E1888 – 信頼できるデータリポジトリの中核的な統一要件

カレントアウェアネス-E

No.320 2017.02.23

 

 E1888

信頼できるデータリポジトリの中核的な統一要件

 

 2016年11月,Data Seal of Approval(DSA)と国際科学会議(ICSU)世界科学データシステム(WDS)は,研究データ同盟(RDA)のDSA-WDS連携Working Group(WG)において策定した,「信頼できるデータリポジトリを認定するための中核的な統一要件」(Core Trustworthy Data Repositories Requirements)を発表した。本記事では,策定に至る背景及び要件の詳細を紹介する。

●背景

 DSAは,データが長期的に発見,理解及び利用されることを目的として,オランダを中心とした国際的な委員会のメンバーによって管理されている基準であり,単に団体名としても用いられる。また,WDSは,品質管理された科学データの長期的な保全と提供によって,ICSUが推進する科学研究事業を支援することを主目的とした団体であり,共にデータリポジトリに係る評価・認証基準を持つ。デジタルリポジトリに係る評価・認証基準は,DSAとICSU-WDS各々のコミュニティで策定された基準のほか,5年ごとの再評価を求めるISO 16363の基準等が存在する。しかしながら,データリポジトリの信頼性を担保するためには,評価対象をその中核部分に絞ることで,より簡便な,より短い周期での調整・修正が可能となる基準が必要,という認識に基づき,2013年頃よりRDAのInterest Group(IG)(E1531参照)の枠組みでICSU-WDSによる新基準の検討が進められていた。2014年にWGへ移行するに当たり,人文・社会科学分野の背景をもつDSAと自然科学系の各分野の活動が中心であったICSU-WDSの両者が連携することで,より中核的な要件を見出す取組みが立ち上げられた。

●要件の詳細

 上述のような背景のもと,WGでは両者の評価基準を比較し中核的な要件を抽出することで,より簡潔なDSAの項目をベースに,16項目に及ぶ要件及び用語集を作成した(見出しは筆者による試訳)。

  • 背景情報(Background information)
  • 組織的な基盤(Organizational Infrastructure)
    • 1.ミッション/視野(Mission/Scope)
    • 2.ライセンス(Licenses)
    • 3.アクセスの継続性(Continuity of access)
    • 4.機密保持/倫理(Confidentiality/Ethics)
    • 5.組織的な基盤(Organizational infrastructure)
    • 6.専門家によるガイダンス(Expert guidance)
  • デジタルオブジェクト管理(Digital Object Management)
    • 7.データの完全性・信頼性(Data integrity and authenticity)
    • 8.評価(Appraisal)
    • 9.保管手続きの文書化(Documented storage procedures)
    • 10.保存計画(Preservation plan)
    • 11.データの品質(Data quality)
    • 12.ワークフロー(Workflows)
    • 13.データの発見と識別(Data discovery and identification)
    • 14.データの再利用(Data reuse)
  • 技術(Technology)
    • 15.技術的な基盤(Technical infrastructure)
    • 16.セキュリティ(Security)

 各々の項目に対する評価は5段階からなる。

  • 0 – 適用不可(Not applicable)
  • 1 – まだ考慮されていない(The repository has not considered this yet)
  • 2 – 概念上は存在する(The repository has a theoretical concept)
  • 3 – 実装フェーズにある(The repository is in the implementation phase)
  • 4 – 実装済(The guideline has been fully implemented in the repository)

 項目ごとに順守レベルをチェックする仕様になっており,概ね3以上のレベルであれば認定されるようだ。全体を通じた評価基準としては,DSAの基準で要件とされていた下記5点が踏襲されている。

  • データの発見可能性(The data can be found on the Internet)
  • データのアクセス性(明確な権利とライセンス付与)(The data are accessible (clear rights and licenses))
  • データの再利用性(The data are in a usable format)
  • データの信頼性(The data are reliable)
  • データの参照可能性(特定性及びリンクの永続性)(The data are identified in a unique and persistent way so that they can be referred to)
 科学データのあるべき管理指針について定めたFAIR原則とも親和性が非常に高く,相互補完的に機能することが期待されている。

 また,本要件による認証に当たっては,3年ごとの再評価が求められる。なお,根拠資料は英語で書かれている必要はないが,自己評価において英語の概要の提出が求められていることにも留意したい。

●認証のメリットと今後の展開

 認証のメリットについては,利害関係者からの信頼性向上,透明性の確保や手続きの改善などが挙げられている。2017年2月現在,DSAでは70件,ICSU-WDSでは80件のリポジトリが既存の基準で認証されている(“re3data.org”の検索画面から,左カラムの“Certificates”を選択すると確認できる)が,ICSU-WDSでは今後のメンバーシップ認定において新しい認証基準を用いることを明言している。

 2017年2月現在,DSA-WDS連携WGでは本要件に対するコメントを広く募っており,将来的には本要件を拡張して国際標準とすることも視野に入れているようだ。日本としても引き続き注目しておく必要がある。

情報・システム研究機構国立極地研究所・南山泰之

Ref:
http://www.datasealofapproval.org/en/
https://www.icsu-wds.org/
https://doi.org/10.5281/zenodo.168411
https://www.rd-alliance.org/filedepot?cid=115&fid=354
https://www.rd-alliance.org/group/repository-audit-and-certification-dsa%E2%80%93wds-partnership-wg.html
https://www.icsu-wds.org/community/membership/community/membership
https://assessment.datasealofapproval.org/apply/
https://www.iso.org/obp/ui/#iso:std:iso:16363:ed-1:v1:en
https://www.rd-alliance.org/groups/rdawds-certification-digital-repositories-ig.html
http://www.forschungsdaten.org/images/0/01/RDA-DE-2015_DSA_WDS.pdf
https://goo.gl/rQK5RN
http://www.datasealofapproval.org/en/assessment/
https://www.force11.org/group/fairgroup/fairprinciples
http://www.datasealofapproval.org/en/assessment/benefits/
http://www.nature.com/articles/sdata201618
http://www.re3data.org/search
https://www.icsu-wds.org/news/news-archive/wds-dsa-unified-requirements-for-core-certification-of-trustworthy-data-repositories
https://www.icsu-wds.org/news/press-releases/wds-dsa-unified-requirements-for-core-certification-of-trustworthy-data-repositories/at_download/file1/Press_Release_WDS-DSA_Core_Certification.pdf
E1531
CA1875