E2160 – オープン・サイテーションと機関リポジトリの展開<報告>

カレントアウェアネス-E

No.373 2019.07.25

 

 E2160

オープン・サイテーションと機関リポジトリの展開<報告>

京都大学附属図書館・西岡千文(にしおかちふみ)
京都大学附属図書館・北村由美(きたむらゆみ)

 

 2019年5月20日,京都大学図書館機構は,2019年度京都大学図書館機構講演会「オープン・サイテーションと機関リポジトリの展開」を開催した。71人の大学図書館職員,研究者,リサーチ・アドミニストレーター(URA)等が参加した。講演会の目的は2点ある。1点目は,学術出版物のオープン・サイテーション(引用データのオープン化)を推進する国際的なイニシアティブとして,2017年4月に設立されたI4OC(Initiative for Open Citations)の取り組みを紹介することで,オープン・サイテーションの概念を日本に導入することである。2点目は,日本でのオープン・サイテーションの実現について検討することである。本稿では講演の内容を紹介する。なお,講演資料は京都大学学術情報リポジトリで公開されている。

●「日本におけるオープンアクセスとオープン・サイテーションの現状」(筆者(西岡))

 ジャパンリンクセンター(JaLC)メタデータに登録されている文献のうち,Crossref DOIが付与され,かつunpaywallに収録されている約200万件の国内出版社により公開された学術出版物を対象に引用データの公開状況を調査した。unpaywallは文献のオープンアクセス版を探索・提供するウェブブラウザの拡張機能であり,拡張機能のデータベースは公開されている。調査結果として,以下の3点を指摘した。

 第一に,引用データをオープンにしている文献の割合は世界では24.22%であるが,国内出版物では18.86%にとどまっている。次に,分野別では,化学・化学工業ではオープン化が26.12%であり,他のSTM分野でも15%前後であるのに対し,政治・法律・行政,哲学・宗教といった分野では1%前後であるというばらつきを指摘した。最後に,人文学系分野において,引用文献データのオープン化の意義を周知することと,引用データの組織化を支援する必要を指摘した。

●「オープン・サイテーション入門:歴史的背景と最近の動向」(I4OC共同設立者/イタリア・ボローニャ大学・シルビオ・ペローニ(Silvio Peroni)氏)

 最初に,オープン・サイテーションにおいて,公開される引用データが満たすべき条件が4点挙げられた。1点目は,データが構造化されていることである。利活用のためには,RDF等の機械可読なフォーマットで提供される必要がある。2点目は,データが分離可能であることである。これは,文献本文にアクセスすることなく,その文献の引用データを取得可能であることを示す。3点目はオープンであることであり,無償のアクセス,制限ない再利用が可能であることを指す。4点目は識別可能であることである。引用データの文献がDOI等の永久識別子等で識別可能であり,識別子を利用して文献のメタデータを取得できることが求められる。

 続いてI4OCについて紹介があった。I4OCは2010年の当時の英国情報システム合同委員会(JISC)のプロジェクトを起源として,2017年4月に設立された。現在は,出版社に対してCrossrefメタデータに登録された各文献の引用データの公開を促進している。Crossrefメタデータには引用データを記述するフィールドが存在し,その公開状況は出版社が選択できる。Crossrefメタデータで引用データを公開することで,Crossref APIを通じた文献の引用データの取得が可能となる。全引用データは,OpenCitationsというI4OCの関連組織のサイトからダウンロードできる。

 その後,欧州の人文学・社会科学系雑誌のデータベースであるERIH Plusに収録されている人文学系の雑誌の分析結果も紹介された。7,226収録誌の中で内容の50%以上が人文学系であると判断された4,386誌のうち,2,841誌がCrossrefに登録されている。人文学系の引用データは自然科学系分野と同様にプレゼンスを示しており,人文学系の研究成果の他分野における引用を可視化した例も示された。

●「オープン・サイテーションが学術情報流通に与えるインパクトと日本でオープン・サイテーションを促進するために」(同志社大学・佐藤翔氏)

 引用データに基づく研究評価指標が広く利用されているが,引用データの多くは有料であり,またデータが存在する学術分野は限定されていることが指摘された。オープン・サイテーションが普及することで,研究評価指標の検証が容易となり,新指標の開発が促進され,さらに,引用データがなかった人文系や非英語文献,紀要などの引用情報も反映できるという期待が述べられた。

 続いて,国内で最も利用されているJ-STAGEや機関リポジトリといった学術出版プラットフォームでのオープン・サイテーションの推進について検討された。紀要はほぼオープンアクセスであるものの,引用データが組織化されていないことが多い。組織化されている場合は,国際的な流通のためにも引用データのデータセットであるOpenCitationsのコーパスへのデータ提供が望まれるとした。

 国内学術出版物の多くには,I4OCが対象とするCrossref DOIでなくJaLC DOIが付与されている。講演外の場でペローニ氏に確認したところ,Crossref DOIが学術出版で最も使用されていることから,I4OCはCrossref DOIをもつ出版物を対象としているとのことである。今後は,単行書の章等の識別子がない文献や他のDOIの文献も対象にしたいとのことであった。人文学・社会科学系分野の研究の広がりを可視化するツールとしても,引用データのオープン化は大きな可能性をもつ。

Ref:
https://www.kulib.kyoto-u.ac.jp/bulletin/1381711
http://hdl.handle.net/2433/241559
https://i4oc.org/
http://opencitations.net/download
https://i4oc.org/press.pdf