CA1980 – データ引用を研究活動の新たな常識に:研究データ利活用協議会(RDUF)リサーチデータサイテーション小委員会の活動 / 能勢正仁,池内有為

PDFファイル

カレントアウェアネス
No.345 2020年9月20日

 

CA1980

 

データ引用を研究活動の新たな常識に:
研究データ利活用協議会(RDUF)リサーチデータサイテーション小委員会の活動

名古屋大学宇宙地球環境研究所:能勢正仁(のせまさひと)
文教大学文学部:池内有為(いけうちうい)

 

1. 背景:データ引用の重要性と最近の動向

 「論文引用」とは、文章中で過去の研究成果を記述する際に、出典として、その過去の研究論文の著者や発表年、タイトル、ジャーナル名などを明示することであり、研究活動の一般的な慣習となっている。こうしたことは、研究論文が研究者の重要な業績として広く認識されていることや、研究論文自体が一般に公開されていること、著者やタイトルといった一意性のある情報が付与されているため引用が容易であること、などによるところが大きい。また、研究論文がどれくらいの回数引用されたかを示す被引用数は、研究論文の発表数に加えて、研究者の学術発展への貢献度を客観的に示す数値として用いられることもある。

 一方、研究活動に伴い収集・生成される研究データについては、最終的に整形された図や表などとして研究論文中に示されるものの、実験や観測で得られた比較的生に近いデータやそれを処理・加工した中間的なデータは、一般的には公開されない。また、研究データの生成や整備、公開といった活動は、研究者の業績としてそれほど重要視はされてこなかった。そのため、研究活動で作成または利用したデータの出典を文章中に明示するという「データ引用」の概念自体が非常に希薄であり、そうした慣習は根付いてこなかった。

 しかしながら最近になって、研究論文と同様に、研究データにも一意性・持続性・一貫性を持ったデジタルオブジェクト識別子(Digital Object Identifier:DOI)を付与していく動きが進んできた。また、「統合イノベーション戦略2019」でも指摘されるように研究データは「知の源泉」(1)であり、国際学会や政府当局において、その整備・利活用が重視されるとともに、科学的発見の根拠、また更に深い知を生むため次世代へ引継ぐべき研究資産、と再認識されるようになってきている。さらには、2012年に起草された「研究評価に関するサンフランシスコ宣言(DORA)」(2)や2017年のG7イタリア・トリノ科学大臣会合での合意(3)等では、研究データを研究論文とならぶ学術業績として認めるべきとする勧告も行われている。こうした背景のもとに、学術出版社はジャーナルにおける研究データ取り扱いのガイドラインやポリシーを相次いで策定するとともに、研究データ同盟(RDA;CA1875E2228ほか参照)では、出版社・ステークホルダーの垣根を超えて、その標準化を図る議論も行われている。地球科学分野では、大学・研究機関・学協会・学術出版社などを会員とする地球科学情報組合(Earth Science Information Partners:ESIP)が、2019年に研究データ引用に関するガイドライン(4)を発表している。

 以上のような近年の急激な動向は、研究活動における研究データの取り扱いに関して、研究者のこれまでの常識を大きく変化させる。特に、研究データの生成・整備・公開といった活動は、一部の研究者が担いながらもその評価は過小になされてきたが、図に示すように、データ引用が行われることによって、研究成果の新たな評価軸として認識されるようになると期待される。さらに、オープンサイエンス推進の一環として、研究データのオープン化を促進するにあたっては、研究データの提供者・管理者やデータセンターの役割が重要であるが、そのインセンティブを確保するためにも、研究データ引用の重要性が広く理解され、それが研究活動の新たな常識になっていく必要がある。

 

図:データ引用による好循環
研究データ利活用協議会・リサーチデータサイテーション小委員会製作のリーフレット
「研究データにDOIを付与するには?」(5)より抜粋。

 

2. 研究データ利活用協議会・リサーチデータサイテーション小委員会

 研究データ利活用協議会(Research Data Utilization Forum:RDUF;E1831参照)は、オープンサイエンスにおいて求められる研究データの整備や流通・保存といった利活用体制の実現に向け、分野を超えて研究データに関するコミュニティの議論・知識共有・コンセンサス形成などを行う場として、2016年6月に設立された研究会(6)である。その前身は、ジャパンリンクセンター(JaLC)により2014年10月から2015年10月まで実施された「研究データへのDOI登録実験プロジェクト」を進める中で形成されたコミュニティであるため、参加会員は、分野横断的に実務レベルで研究データを扱う研究者、図書館員や行政機関職員といった異なる立場の関係者からなっている。RDUFでは、研究データの利活用を促進するための個別テーマについて小委員会を設置し、ガイドライン・ノウハウ集・事例集・基礎資料・提言のとりまとめを行うなど、そのテーマに関わりのあるステークホルダーが、ボトムアップ的な活動を行ってきた。

 RDUF発足以来、研究データライセンス、研究データリポジトリ、研究データマネジメントをテーマとした小委員会が活動してきたが、2019年1月には、研究データ引用を取り扱う「リサーチデータサイテーション(Research Data Citation)小委員会」が設置(7)されることとなった。この小委員会の提案は、「研究データ利活用を推進するためには、データ公開者のインセンティブの確保が重要であり、そのためには、研究論文での研究データ引用が一般化し、引用・被引用関係が把握できるようになることが必要だが、研究データの引用は進んでいないのが現実である」という認識に基づいている。小委員会には、研究者、出版社、学会、図書館、情報流通業者等、職種の壁を越えて研究データ引用に関わるメンバー約20人(筆者ら2人を含む)が参加し、2020年6月までの1年半の間、各ジャーナルにおけるデータ取り扱い(投稿規定等)の現状や国内外における研究データの利活用に向けた取り組み事例を調査(E2234参照)し、データ引用を取り巻く状況を把握することや、その調査結果を元に、データ引用の普及に向けた課題の解決方策に関する議論を行ってきた。

 

3. 小委員会の活動成果

 リサーチデータサイテーション小委員会は、設置以来、6回の定期会合開催に加え、Japan Open Science Summit 2019(JOSS2019;E2155参照)におけるセッション「研究活動の新たな常識としてのデータ引用の実現に向けて」の開催(2019年5月27日)(8)や研究データ同盟第14回総会(E2228参照)でのジャーナルポリシー調査結果のポスター発表(2019年10月)(9)を行った。その他の主な成果物としては次のようなものが挙げられる。

 

3.1. リーフレット「研究データにDOIを付与するには?」の製作と印刷・配布

 データ引用を可能にするためには、研究データに一意的・持続的にたどり着くことができるDOIを付与する必要がある。しかしJOSS2019におけるセッションでの議論や研究データを扱う研究者との対話から、「DOIを付与するための手続きや相談先が分からない」「実際にDOIを付与する際に要する手間や費用を知りたい」という要望があることが明らかになってきた。研究者はその分野の研究やデータそのものについては詳しいが、上述のような研究データに関する近年の潮流に関しては疎いことが少なくない。そこで、DOIを付与する際の参考となるよう、研究者自身やその所属機関にとってのDOI付与のメリットを解説し、DOIの働きや仕組み・準備するもの・具体的な手続き・恒久性保証のための留意点などの情報を盛り込んだリーフレットを製作することにした(E2233参照)。リーフレットはA4サイズ・巻き3つ折りで、一目で伝わる形態にした。(副題は「5分で分かる研究データDOI付与」としている)リーフレットは、オープンサイエンスに関連する会議・会合などで配布することにしている。

 

3.2. 「データ引用原則の共同宣言」の日本語訳公開

 データ引用の重要性を理解したステークホルダーがデータ引用を推進する際の参考資料として、国際組織FORCE11 (The Future of Research Communications and e-Scholarship)による「データ引用原則の共同宣言(Joint Declaration of Data Citation Principles:JDDCP)」(10)の日本語訳(11)を公開した(E2234参照)。FORCE11は、データ公開の適切な実施方法に関する「FAIR原則」も提案している(E2052参照)。

 JDDCPは2014年に公開され、2020年6月現在、研究者など個人287人、学術出版社、学協会、データセンターなど122機関が賛同している。データ引用の目的、効用、実践上の注意などがコンパクトにまとめられており、データ引用の手引きとして有用である。詳しい内容は別稿(E2234参照)で紹介している。

 

4. 学術雑誌のデータ公開ポリシー

 研究者がデータ公開に至る要因の一つは、論文を投稿しようとする学術雑誌のポリシーであることが国内外の調査によって明らかにされてきた(12)(13)。それでは、各分野の学術雑誌はどの程度データ公開やデータ引用を要求しているだろうか。本小委員会は、2019年4月から5月にかけて、学術雑誌による(1)リポジトリにデータを登録するよう求めるポリシーと、(2)論文の補足資料としてデータを掲載するよう求めるポリシーの有無や要求レベル、および(3)データ引用の要求レベルや引用方法に言及したポリシーを調査した。調査対象は、2014年に実施された筆者(池内)らの調査(14)と同様の220誌(22分野のインパクトファクターが高い雑誌、各10誌)として、結果を比較した。

 まず、「(1)リポジトリ」のポリシーを掲載している雑誌は、59.5%(2014年)から85.0%(2019年)まで増加していた。データ公開を必須として強く要求する雑誌は41.8%であった。2014年には経済学分野と工学分野の雑誌(各10誌)にはポリシーが掲載されていなかったが、本調査では全分野で少なくとも3誌以上がポリシーを掲載していた。「(2)補足資料」のポリシーはほとんど変化がなく、約9割(89.5%(2014年)と90.9%(2019年))に掲載されていた。「(3)データ引用」のポリシーは、55.0%の雑誌が掲載していた。なお、JDDCPに言及していた雑誌は全体の26.3%であった。前述のとおり、これらの調査結果についてはRDA第14回総会でポスター発表を行った。

 まとめると、雑誌によるデータ公開の要求は多くの分野で増加している一方で、データ引用を求めている雑誌はそれほど多くはなかった。より多くの雑誌がデータ公開とあわせてデータ引用も要求するようになり、データを引用する論文が増えれば、データへのアクセスが容易になり、利活用が促進され、公開者への評価やインセンティブにも繋がるのではないだろうか。

 

5. 結語

 リサーチデータサイテーション小委員会活動の総括報告は、2020年3月と6月に開催予定であったRDUF公開シンポジウムとJOSS2020において行う予定であったが、新型コロナウイルス感染拡大防止の観点からこれらのシンポジウムが中止になった。そのため、同様のシンポジウム開催の機会に総括を行うことを検討している。これまでの小委員会の成果物や総括報告は、RDUFの成果物のウェブページ(15)に掲載していく。本小委員会の活動が、データ公開者への評価やインセンティブを確立する契機となり、やがてデータ引用が研究活動の常識となることを願っている。

 

(1) “統合イノベーション戦略2019”. 内閣府. 2019-06-21.
https://www8.cao.go.jp/cstp/togo2019_honbun.pdf, (参照 2020-06-30).

(2) “研究評価に関するサンフランシスコ宣言”. DORA.
https://sfdora.org/read/jp/, (参照 2020-06-30).
DORAとは、インパクトファクターのような学術雑誌を基準とした指標の濫用に反対し、研究評価の改善を求める宣言である。2020年7月現在、世界各国の1,981機関、1万6,000人以上が署名している。

(3) “G7イタリア・トリノ科学大臣会合”. 内閣府.
https://www8.cao.go.jp/cstp/kokusaiteki/g7_2017/2017.html, (参照 2020-06-30).

(4) ESIP Data Preservation and Stewardship Committee. Data Citation Guidelines for Earth Science Data, Version 2. figshare. 2019-07-02.
https://doi.org/10.6084/m9.figshare.8441816, (accessed 2020-06-30).

(5) RDUF. “研究データにDOIを付与するには?:5分で分かる研究データDOI付与”. 2019-12-20.
https://doi.org/10.11502/rduf_rdc_doileaflet, (参照 2020-06-30).

(6) RDUF.
https://japanlinkcenter.org/rduf/, (参照 2020-06-30).

(7) “RDUF小委員会テーマ提案書”. RDUF. 2018-11-30.
https://japanlinkcenter.org/rduf/doc/rduf_shoiinkai_4.pdf, (参照 2020-06-30).

(8) “G1 研究活動の新たな常識としてのデータ引用の実現に向けて”. JOSS2019.
https://joss.rcos.nii.ac.jp/2019/session/0527/?id=se_113, (参照 2020-06-30).

(9) Ikeuchi, U.; Abe, M.; Hayashi, K.; Nomura, N.; Okayama, N.; Owashi, M.; Sumimoto, K.; Takahashi, N.; Toda, Y.; Nosé, M. Journal Research Data Policy Across Disciplines: Comparison Between 2014 and 2019. figshare. 2019-11-08.
https://doi.org/10.6084/m9.figshare.10025330, (accessed 2020-06-30).

(10) Martone, M. “Joint Declaration of Data Citation Principles – FINAL”. FORCE11. 2014.
https://doi.org/10.25490/a97f-egyk, (accessed 2020-06-30).

(11) Martone, M. “データ引用原則の共同宣言 – 最終版”. RDUF リサーチデータサイテーション小委員会訳. RDUF.
https://doi.org/10.11502/rduf_rdc_jddcp_ja, (参照 2020-06-30).

(12) Wiley Market Research. Wiley Open Science Researcher Survey 2016 Infographic. figshare. 2017-04-26.
https://doi.org/10.6084/m9.figshare.4910714, (accessed 2020-06-30).

(13) 池内有為. 日本における研究データ公開の状況と推進要因,阻害要因の分析. Library and Information Science. 2018, no. 79, p. 21-57.
http://lis.mslis.jp/pdf/LIS079021.pdf, (参照 2020-06-30).

(14) 池内有為, 逸村裕. 学術雑誌によるデータ共有ポリシー:分野間比較と特徴分析. 日本図書館情報学会誌. 2016, vol. 62, no. 1, p. 20-37.
https://doi.org/10.20651/jslis.62.1_20, (参照 2020-06-30).

(15) “成果物”. RDUF.
https://japanlinkcenter.org/rduf/deliverable/, (参照 2020-06-30).

 

[受理:2020-07-21]

 


能勢正仁, 池内有為. データ引用を研究活動の新たな常識に:研究データ利活用協議会(RDUF)リサーチデータサイテーション小委員会の活動. カレントアウェアネス. 2020, (345), CA1980, p. 2-4.
https://current.ndl.go.jp/ca1980
DOI:
https://doi.org/10.11501/11546850

Nosé Masahito
Ikeuchi Ui
Data Citation as the New Standard of Research Activity: Report of Research Data Citation Subcommittee, Research Data Utilization Forum (RDUF)