E2162 - どの研究データを保存すべきか:英・Jiscによる調査レポート

カレントアウェアネス-E

No.373 2019.07.25

 

 E2162

どの研究データを保存すべきか:英・Jiscによる調査レポート

関西館図書館協力課・宮田怜(みやたれい)

 

 英国のJiscは2019年3月に保存すべき研究データに関する調査レポート“What to Keep: A Jisc Research Data Study”を公開した。本稿では,調査レポートの主要パートである,保存すべき研究データ(3章)・研究データ保存の現況(4章)・研究データ保存の課題・改善案(5章)に関する調査分析と利害関係者への提言を中心にその内容を概観する。

●調査の背景と概要

 調査は2018年5月から2019年1月にJiscの委託を受けたCharles Beagrie社により行われた。大学・研究機関等の研究データ専門家へのインタビュー,文献調査等のデスクリサーチ,事例研究,これらの調査結果で得られた知見の検討,利害関係者への提言作成を目的としたワークショップが実施され,一連の成果が調査レポートとして取りまとめられた。

●保存すべき研究データ

 一部の研究分野や機関にはすでに保存すべき研究データのチェックリストが存在する。既存のチェックリスト4種がデスクリサーチによりレビューされ,研究データ専門家への調査インタビューと比較しながら,保存すべき研究データとは何かが検討された。特に保存すべき研究データのユースケースとして,次の点が重要な知見として示されている。

  • 研究上の発見の裏付けとなるデータを利用可能とすること(「研究公正・再現可能性」)と他者と共有するためのデータを利用可能とすること(「再利用の可能性」)の2つが主要なユースケースである。
  • 「研究公正・再現可能性」と「再利用の可能性」は保存すべき研究データの種類,保存期間,保存場所,保存方法について異なる形で影響している可能性がある。

 ユースケースが研究データ保存に与える影響はいくつかのレポート内の事例研究で具体的に示されている。例えば,英国のScience and Technology Facilities Council(STFC)は「研究公正・再現可能性」の観点からは生データ,及びデータ処理の一連のプロセスを示したパイプラインの保存が,「再利用の可能性」の観点からは最終的な成果物が利用可能であることが必要である,としている。

 その他,以下のような点も重要な知見として示されている。

  • 研究データはデータレベル(生データ・加工データ等),データタイプ(実験データ・観察データ等),データの起源(プロジェクトの副産物・リソース生成を主目的とする研究プロジェクトで得られたもの等)において多様である。
  • 研究分野ごとに成熟段階や求められるニーズには相違がある。
  • 何を保存すべきかに関する上位レベルの包括的基準には,すでに幅広い合意が形成されており,複数の研究分野に適用されつつある。
  • 研究データ保存について,保存する種類,理由だけでなく,保存期間,保存場所,そして,潜在的な価値と費用,利用可能な資金を反映した保存方法を検討することが重要である。

 これらを踏まえて,次の5つの提言が行われた。

  • チェックリスト等既存の研究データ保存に関する活動が研究分野を超えて適用可能かどうかを検討すること
  • 未成熟または発展途上の研究分野に対して,研究データ保存の基準を検討させるワークショップ開催を支援すること
  • 研究助成の要件について不要な相違を除去し,調和に努めること
  • 「研究公正・再現可能性」と「再利用の可能性」の各ユースケースにおいて,保存すべき研究データのストレージ,選定,キュレーションレベルの異なるデータの相対的なコストや利益について調査すること
  • FAIR原則(E2052参照)やRDA(E2144ほか参照)等の既存の枠組みを活用すること

●研究データ保存の現況

 研究データ保存の現況を知るためのインタビューが実施され,以下のような点が重要な知見として示されている。

  • 機関の中心的リポジトリに保存された研究データは把握されているが,それ以外の場所に保存された研究データは把握されていないことが多い。
  • どの研究プロジェクトが研究データを生成したのか,プロジェクトの生成した研究データの総数,研究データの保存場所について,研究成果や助成金データベース等の情報源から明らかにすることがしばしば困難である。

 これらを踏まえて,次の2つの提言が行われた。

  • データの発見可能性を高め保存された研究データを明確に特定可能にすること
  • 研究データをエビデンスとして活用する場面では全ての研究論文に対してデータにどのようにアクセスできるかに関する“Data Access Statements”を要求すること

 特に後者の提言については,科学研究の公開・公正性・再現可能性の増進を使命とする米国の非営利団体Center for Open Science(COS)が提供するTransparency and Openness Promotion(TOP) Guidelines適用を推奨している。

●研究データ保存の課題・改善案

 研究データ保存の課題と改善案に関するインタビューも実施され,以下のような点が重要な知見として示されている。

  • 量的に増大する研究データの保存が課題であり,改善のための提案として,データ選定の強化や資金の追加,ストレージの段階的な導入等が挙げられる。
  • データ共有を目的とした助成条件を順守できていないことが課題であり,改善のための提案として,引用などデータ利用のインセンティブを高めること,データ保存ワークフローの自動化を進めること等が挙げられる。
  • 高額に思われる研究データ管理コストが課題であり,改善のための提案として,研究データ保存の価値のより一層の実証,持続可能なモデル形成等が挙げられる。

 これらを踏まえて,次の3つの提言が行われた。

  • 研究データ共有のインセンティブを高め障壁を低減すること
  • 研究データに関する出版社と研究助成機関の協調を進めること
  • 研究データ管理のどのようなコストを誰が担えるかについて議論を促進すること

 保存すべき研究データについて,「研究公正・再現可能性」,「再利用の可能性」が主要なユースケースであることが確認された。一方,分野やデータタイプ別の保存期間,保存場所,保存方法についてはまだ試行錯誤が続く段階であり,発展の途上にあることが指摘されている。

Ref:
https://researchdata.jiscinvolve.org/wp/2019/03/07/research-data-to-keep-or-not-to-keep/
https://repository.jisc.ac.uk/7262/1/JR0100_WHAT_RESEARCH_DATA_TO_KEEP_FEB2019_v5_WEB.pdf
https://cos.io/top/
E2052
E2144