E2296 – データリポジトリの信頼性に関するTRUST原則

カレントアウェアネス-E

No.397 2020.09.03

 

 E2296

データリポジトリの信頼性に関するTRUST原則

国立情報学研究所オープンサイエンス基盤研究センター・南山泰之(みなみやまやすゆき)

 

  データリポジトリの信頼性に関するTRUST原則(The TRUST Principles for digital repositories:以下「TRUST原則」)は, 2020年5月に公表された,デジタルリポジトリの信頼性を実証するための一連の指針である。本稿では,公表までの経緯や要件の概要,他の基準との関わりを紹介する。

●公表までの経緯

   TRUST原則に関する構想は,当初CoreTrustSealのボードメンバーによって検討され,2019年4月に開催された第13回研究データ同盟(RDA)総会のセッションで,正式にコミュニティによる議論が開始された。同セッションではTRUST原則のホワイトペーパー草案(Ver. 0.01)が公開され,翌週に米国立衛生研究所(NIH)で開催されたワークショップ,RDA総会のセッション等を通じて議論が続けられた。議論の進展に伴いホワイトペーパーも数度の改訂が加えられ,翌年5月にはリン(Dawei Lin)氏らによりSpringer Nature社のオープンアクセス(OA)ジャーナル“Scientific Data”において同原則が公表されるに至っている。

●要件

   TRUST原則は,透明性(Transparency),責任(Responsibility),ユーザーフォーカス(User Focus),持続性(Sustainability),技術(Technology)の5つの要件からなる。以下では,リン氏らによる文献をもとに,提案されている各原則およびリポジトリへの指針に加え,それぞれについて挙げられている明示/実践の具体例を紹介する。

  • 透明性:リポジトリサービスと保持するデータを,誰でもアクセスできるエビデンスで検証可能にし,透明性を保つこと
    【明示の具体例】
    • リポジトリの使命,スコープを明示する
    • リポジトリと保持するデータの両方の使用条件を示す
    • 保持するデータの最低保存期間を示す
    • 関連する追加機能やサービスを明示する。例えば,機密データの管理責任に関する機能など
  • 責任:保持するデータの信憑性と完全性を確保し,サービスの信頼性と永続性に責任を負うこと
    【実践の具体例】
    • 対象コミュニティのメタデータとキュレーションの標準を遵守し,技術的検証,文書化,品質管理,真正性の保護,長期保存など,保持するデータのスチュワードシップを提供する
    • ポータルやマシンインターフェース,データダウンロード,サーバサイド処理などのデータサービスを提供する
    • データ作成者の知的財産権,機密情報資源の保護,システムとコンテンツのセキュリティを管理する
  • ユーザーフォーカス:データ管理における達成基準とユーザーコミュニティからの期待を一致させること
    【実践の具体例】
    • 関連するデータの指標を実装し,ユーザーが利用できるようにする
    • データの発見を促進するため,コミュニティカタログを提供(または貢献)する
    • 進化するコミュニティの期待をモニタリングして特定し,変化するニーズに適宜対応する
  • 持続性:サービスを持続させ,保持するデータを長期に保存すること
    【実践の具体例】
    • リスク軽減,事業継続,災害復旧,継承のために十分な計画を立案する
    • リポジトリが保存・普及を担うデータ資源に対して,継続的な利用と望ましい特性を維持することで,信頼を得続けるための資金を確保する
    • データ資源が将来にわたり発見・アクセス・利用可能であるために,データの長期保存に必要なガバナンスを提供する
  • 技術:安全で,永続的かつ信頼できるサービスをサポートするためのインフラと機能を提供すること
    【実践の具体例】
    • データ管理とキュレーションのために,関連する適切な標準,ツール,技術を実装する
    • サイバーセキュリティや物理セキュリティ上の脅威を防止し,検知し,対応するための計画と仕組みを持つ

●TRUST原則の位置づけ

   ホワイトペーパー(Ver. 0.03)内では,TRUST原則を検討する動機が“Who can we trust to enable FAIR?”と述べられている。データ公開の適切な実施方法を示す基準としてFAIR原則(E2052参照)が提唱されているが,同原則は,将来にわたってデータが保存され,分析結果の検証に利用できることを保証するものではない。TRUST原則は責任を持ってデータを管理・普及し,長期間にわたってFAIRな状態を維持するために必要なリポジトリの特性を記述している。

   また,同ペーパー内では関連するモデルや基準として,Open Archival Information System(OAIS)参照モデル(CA1489参照)や,実装レベルの認証基準である「信頼できるデータリポジトリを認定するための中核的な統一要件」(Core Trustworthy Data Repositories Requirements;E1888参照)などとの違いについて整理が試みられている。OAIS参照モデルは,アーカイブ情報システムの管理のための原則と用語の首尾一貫した包括的な枠組みを提供している。しかし,信頼性を評価するためには,参照モデルであるOAISが扱っていない要素として,適切なガバナンス,リソース,セキュリティなどに対応した基準が必要なほか,さまざまな解釈や実装を許容するための定期的な監査や認証の仕組みが必要である。ISO 16363(Audit and Certification of Trustworthy Digital Repositories),DIN 31644(Information and documentation – Criteria for trustworthy digital archives),前述の統一要件などのリポジトリ認証要件はこれに応えるものであるが,認証の種類やレベルが複数存在しており,リポジトリが提供するサービスの評価を行う客観的な指針が存在していない。TRUST原則は,様々なリポジトリの認証基準を満たす概念的なフレームワークを提供し,資金提供者やリポジトリの利用者も含めた形で客観的な指針を示すことを企図している。

●今後の展開

   TRUST原則は,2020年8月時点で27機関が支持を表明している。国内においては,近しい基準として2019年に内閣府より「研究データリポジトリ整備・運用ガイドライン」が公表されており,どのように両者の関係性を整理すべきか議論の余地があろう。引き続き動向を注視していきたい。

Ref:
“CoreTrustSeal”.
https://www.coretrustseal.org/
“IG RDA/WDS Certification of Digital Repositories – RDA 13th Plenary Meeting”. RDA. 2019-04-04.
https://www.rd-alliance.org/ig-rdawds-certification-digital-repositories-rda-13th-plenary-meeting-0
“Trustworthy Data Repositories Workshop”. National Institute of Health, Office of Data Science Strategy.
https://datascience.nih.gov/data-ecosystem/trustworthy-data-repositories-workshop
“The TRUST Principles for Trustworthy Data Repositories – An Update”. RDA/WDS Certification of Digital Repositories IG. 2019-09-13.
https://www.rd-alliance.org/trust-principles-trustworthy-data-repositories-%E2%80%93-update
Lin, Dawei., et al. The TRUST Principles for digital repositories. Scientific Data. 2020, 7, 144.
https://doi.org/10.1038/s41597-020-0486-7
Lin, Dawei., et al. The TRUST Principles for Digital Repositories – A White Paper Version 0.03 (draft). 2019, 22p.
https://docs.google.com/document/d/1pbRw1uf-W-BRMxjj8ZNZJHQTI-ggLjRWq8jiu4Oy6Yc/edit
Wilkinson, Mark. D. et al. The FAIR Guiding Principles for scientific data management and stewardship. Scientific Data. 2020, 3, 160018.
https://doi.org/10.1038/sdata.2016.18
The Consultative Committee for Space Data Systems. ISO 14721:2012 Reference Model for an Open Archival Information System (OAIS). MAGENTA BOOK, 2012.
https://public.ccsds.org/Pubs/650x0m2.pdf
CoreTrustSeal Standards and Certification Board. CoreTrustSeal Trustworthy Data Repositories Requirements 2020–2022. 2019, 2p.
http://doi.org/10.5281/zenodo.3638211
“The TRUST Principles: An RDA Community Effort”. RDA. 2020-05-18.
https://www.rd-alliance.org/rda-community-effort-trust-principles-digital-repositories
国際的動向を踏まえたオープンサイエンスの推進に関する検討会. 研究データリポジトリ整備・運用ガイドライン. 2019, 13p.
https://www8.cao.go.jp/cstp/tyousakai/kokusaiopen/guideline.pdf
八塚茂. FAIR原則と生命科学分野における取組状況. カレントアウェアネス-E. 2018, (353), E2052.
https://current.ndl.go.jp/E2052
南山泰之. 信頼できるデータリポジトリの中核的な統一要件. カレントアウェアネス-E. 2017, (320), E1888.
https://current.ndl.go.jp/e1888
栗山正光. 動向レビュー:デジタル情報保存のためのメタデータに関する動向. カレントアウェアネス. 2003, (275), CA1489, p. 13-16.
https://doi.org/10.11501/1012127

 

 

クリエイティブ・コモンズ 表示 4.0

※本著作(E2296)はクリエイティブ・コモンズ 表示 4.0 国際 パブリック・ライセンスの下に提供されています。ライセンスの内容を知りたい方はhttps://creativecommons.org/licenses/by/4.0/legalcode.jaでご確認ください