E1537 – 研究データへの識別子付与と引用可能性向上:DataCiteの活動

カレントアウェアネス-E

No.254 2014.02.20

 

 E1537

研究データへの識別子付与と引用可能性向上:DataCiteの活動

 

 研究データのインターネット上での公開が進む中,それらが発見され,適切に活用されるためには,識別子やメタデータが適切に付与され,引用可能(Citable)な状態になることが肝要である。この,研究データの共有と活用の向上にむけて活動を行っている国際コンソーシアムとして“DataCite”がある。そのメンバーや連携機関,主要な活動,そして研究データの引用可能性向上に向けた関連動向を紹介する。

 DataCite(International Data Citation Initiative:国際データ引用イニシアティブ)は,2009年12月に英国のロンドンを本拠に設立されたコンソーシアムである。会員となっているのは,英国図書館(BL),ドイツ国立科学技術図書館(TIB),ドイツ経済学中央図書館(ZBW),ドイツ国立医学図書館(ZB MED),米国のカリフォルニア・デジタル図書館,パデュー大学図書館など,現在18機関ある。このほか,連携機関として,デジタルキュレーションセンター(DCC),国際科学会議世界科学データシステム(ICSU-WDS),世界各国の社会科学に関する調査データをアーカイブするICPSR(Inter-university Consortium for Political and Social Research)などが名を連ねている。事務局はTIBが務めている。

 DataCiteは,2013年9月に,ワシントンD.C.で開催された研究データ同盟(RDA)総会(E1531参照)に続き,同じ場所で第4回となる夏季会議を開催した。DataCiteのメンバーがRDAに設立時から関与しているという事情から実現したものである。会議の概要については,D-Lib Magazine誌の2014年1/2月号にDataCiteの会長でありBLの電子図書館技術部長でもあるファークアー(Adam Farquhar)氏と,TIBのブレイズ(Jan Brase)氏が記事を寄せている。また,『情報管理』1月号には,同会議の日本からの参加者の報告が掲載されている。

 DataCiteは,科学と研究の促進のため,研究データにインターネット上で容易にアクセスできるようにすることを目指し活動している。具体的には,研究データを発見し特定し引用する方法を提供することであり,そのために,国際DOI財団(The International DOI Foundation)の登録機関(Registration Agency:RA)のひとつとして,研究データのデジタルオブジェクト識別子(DOI)を登録・維持する役割を担っている。DataCiteの会員機関は,計250機関以上のデータ受託機関と共同し,これまでに200万件以上の研究データにDOIを付与しているという。DOIが付与されているデータには,社会科学系の調査データも含まれる。2014年2月10日には,ICPSRの社会調査等の調査データ20,000件のDOIについて,DataCiteで維持するようになったことが発表されている。

 研究データが研究において有効に活用されるためには,永続的な識別子とメタデータにより引用可能になることだけでは不十分と考えられる。上述のファークアー氏らによる会議報告でも言及されているが,研究文献,研究データ,研究者情報の3要素が,相互に関連付けられ,統合的に利用できる形で提供されることも重要であると考えられる。DataCiteでは,欧州委員会の第7次研究開発フレームワーク計画のもと,研究者に識別子を付与するORCID(CA1740参照)との相互リンクを進めるプロジェクトODIN(ORCID and DataCite Interoperability Network)を進めている。

 例えば,ヒッグス粒子発見の観測データにDataCiteのDOIが付与されたことが,同会議及びDataCiteのウェブサイトで発表されているが,そのDOI(10.7484/INSPIREHEP.DATA.A78C.HK44)にアクセスすると,メタデータ,成果を発表した論文,データ生成に貢献した多数の研究者の情報を確認することができる。研究文献,研究データ,研究者情報を,識別子を介して統合し提供することの利便性が理解されよう。

 研究データの引用可能性を確実なものとすることにむけて,DataCiteをはじめ関係機関で,各種のドキュメント類が整備されてきている。DataCiteでは研究データのためのメタデータスキーマを公表しており,2013年7月にはバージョン3へとアップデートした。またRDAでも,PID Information Types WGで研究データの永続的識別子のユースケースがまとめられるなど,基盤的技術に関する検討が進められている。また2013年10月には,科学技術データ委員会(CODATA)と科学技術情報会議(ICSTI)が“Out of Cite, Out of Mind: The Current State of Practice, Policy, and Technology for the Citation of Data”を公表し,研究データの引用についての現状を整理しているところである。この他,学術コミュニケーションの進展のため活動するコミュニティFORCE11でも,“Data Citation Principle”の作成をすすめ,2013年末にはそのドラフト版が公開され,コメントの募集も行われた。研究データの活用基盤の整備にむけた取り組みには,引き続き注目していく必要がある。

関西館図書館協力課・依田紀久

Ref:
http://www.dlib.org/dlib/january14/farquhar/01farquhar.html
http://dx.doi.org/10.1241/johokanri.56.728
http://www.datacite.org/
http://www.datacite.org/docs/datacite-statutes-final.pdf
http://www.datacite.org/node/112
http://odin-project.eu/
http://www.datacite.org/higgs-boson
http://doi.org/10.7484/INSPIREHEP.DATA.A78C.HK44
http://www.force11.org/datacitation
http://dx.doi.org/10.2481/dsj.OSOM13-043
E1531
CA1740