E2011 – 次世代リポジトリの機能要件および技術勧告

カレントアウェアネス-E

No.344 2018.03.22

 

 E2011

次世代リポジトリの機能要件および技術勧告

 

 2017年11月28日,オープンアクセスリポジトリ連合(COAR)の次世代リポジトリワーキンググループは,「次世代リポジトリの機能要件および技術勧告(Next Generation Repositories Behaviours and Technical Recommendations of the COAR Next Generation Repositories Working Group)」を発表した。同報告書には,次世代リポジトリとしての11の機能要件とその機能要件に関係する技術勧告が示されている。同ワーキンググループは,次世代リポジトリのビジョンを「リポジトリを,分散型でグローバルにネットワーク化された学術コミュニケーションのインフラストラクチャの基礎として位置付け,その上に付加価値サービスを積み重ね,それにより(商業出版社に支配された)既存のシステムを,より研究中心的で革新的な,学術コミュニティによって共同管理されたシステムに,変えていくこと。」と定義している。次世代リポジトリは,従来の人間によるアクセスだけでなく機械的な処理が可能であることを重視しており,11の機能要件は付加価値サービスおよび機械アクセスを強く意識した内容である。以下,11の機能要件と,関係する技術勧告を挙げる。

●識別子の公開(Exposing Identifiers)

 次世代リポジトリは,すべての研究成果をウェブの情報資源(リソース)として処理するリソース中心設計を採用している。技術勧告のSignpostingは,HTTPアクセスの際のヘッダ情報に書誌情報,権利情報,永続的識別子といったリソースの関連情報を提示するための通信プロトコルであり,機械による情報資源へのアクセスを支援する。

●リソースレベルでのライセンスの明示(Declaring Licenses at a Resource Level)

 次世代リポジトリでは,リソース単位で研究成果の使用ライセンスを明示することが求められる。技術勧告のSignpostingを用いることで,機械に対してリソース単位でクリエイティブ・コモンズ・ライセンス(CCライセンス)といった使用ライセンスを提示することが可能となる。

●ナビゲーションによる発見(Discovery through Navigation)

 次世代リポジトリでは,機械も人間と同様,リソースの意味を理解し,処理することが望まれる。技術勧告のSignpostingは機械に対してリソースの関連情報を提供することができ,機械がリソースの内容を判断して処理することを支援する。

●リソースとの相互作用(アノテーション,コメント,レビュー)(Interacting with Resources (Annotation, Commentary and Review))

 付加価値サービスの一種であるコメント機能やアノテーション機能など,付加的なコンテンツの作成機能は,学術コミュニケーションの中心に次世代リポジトリを位置付けるための重要な機能要件である。技術勧告のActivity Streams 2.0はウェブでのユーザ行動を記述するためのデータモデル,Web Annotation ModelおよびWeb Annotation Protocol(E1916参照)はウェブにおける汎用的なアノテーション記述,IIIF(E1989参照)は画像データの相互運用のためのフレームワークである。

●リソースの転送(Resource Transfer)

 次世代リポジトリは,テキスト・データ・マイニング(TDM)を支援するため,効率的なリソース転送を実現する必要がある。技術勧告のIPFSはPeer-to-Peer(P2P)技術を活用した分散型ハイパーメディアシステムである。従来のウェブがクライアント・サーバ型モデルであるのに対し,IPFSはP2P型モデルによる完全分散型のウェブの実現を目的としたシステムである。ResourceSync(CA1845参照)はOAI-PMHの後継規格に位置付けられる2つのウェブサーバの間でコンテンツの同期を行うためのプロトコル,SWORDは汎用的なコンテンツ登録のためのプロトコルである。

●バッチディスカバリ(Batch Discovery)

 次世代リポジトリは,従来のリポジトリと同じようにアグリゲータと連携し,リポジトリ横断的なリソース発見を支援する必要がある。技術勧告として,ResourceSync,Signposting,Googleクローラなどのウェブクローラに対して,クロールすべきURLを通知するSitemapsが取り上げられている。

●アクティビティの収集・公開(Collecting and Exposing Activities)

 次世代リポジトリの特徴の一つは能動的(Active)であることである。次世代リポジトリは,従来のリポジトリのようにクライアントからのリクエストに対して受動的にコンテンツを提供するだけでなく,研究成果に付与されたコメント,アノテーションなどのユーザ行動(アクティビティ)を積極的に収集し,公開する。収集したアクティビティはリコメンドシステムなどの付加価値サービスで利用される。技術勧告として,Activity Streams 2.0,アクティビティ通知のためのLinked​ Data Notifications,ResourceSync Change Notifications,Signposting,Webmention,WebSub等が取り上げられている。

●ユーザの識別(Identification of Users)

 ユーザの識別は,付加価値サービスを提供するうえで必要な機能である。次世代リポジトリでは,ユーザの識別が可能になることで,ユーザのアクティビティを記録したり,学術リソースに対するコメントやアノテーションの付与が可能となる。技術勧告として,研究者の識別子であるORCID(CA1740参照),各種ソーシャル・ネットワークサービスが提供するユーザの識別子,ウェブにおける人・組織を識別するための識別子WebIDが取り上げられている。

●ユーザの認証(Authentication of Users)

 ユーザの認証は付加価値サービスを提供するうえで必要な機能である。前述のように,付加価値サービスを提供する上で,ユーザの識別は必須であり,そのためには,ユーザを認証する必要がある。技術勧告として,HTTPプロトコルへの署名プロトコルHTTP Signatures,ID連携のためのプロトコルOpenID Connect 1.0,WebIDを用いた認証プロトコルWebID/TLSを取り上げている。

●標準化された利用状況メトリクスの公開(Exposing Standardized Usage Metrics)

 次世代リポジトリでは,国際的に標準化された利用状況メトリクス(指標)を採用することで,リポジトリ間の利用状況の比較が可能となる。技術勧告として,COUNTER(CA1512参照),SUSHI(E419参照),ウェブのリソースのバージョンを表現するETagを取り上げている。

●リソースの保存(Preserving Resources)

 報告書での技術勧告はいまのところ存在しない。しかしながら,共通の標準,プロトコル,相互運用性を保持するリソース保存機能が登場すれば,将来的に,分散ネットワーク化されたリポジトリ間でリソース保存機能を共有することが可能となる。

 本報告書については,GitHubでバージョン管理されており,技術進化に合わせて今後も内容を更新していくようである。今後,本報告書に基づく次世代リポジトリの機能実装が各国で進むものと推察される。日本としても引き続き動向を注目しておく必要がある。

国立情報学研究所・林正治

Ref:
https://www.coar-repositories.org/files/NGR-Final-Formatted-Report-cc.pdf
http://ngr.coar-repositories.org/
https://github.com/coar-repositories/ngr
https://signposting.org/
https://creativecommons.org/licenses/
https://www.w3.org/TR/activitystreams-core/
https://www.w3.org/TR/activitystreams-vocabulary/
https://www.w3.org/TR/annotation-model/
https://www.w3.org/TR/annotation-protocol/
http://iiif.io/
https://ipfs.io/
http://www.openarchives.org/rs/
http://swordapp.org/
https://www.sitemaps.org/
https://www.w3.org/TR/ldn/
http://www.openarchives.org/rs/notification
https://www.w3.org/TR/webmention/
https://www.w3.org/TR/websub/
https://orcid.org/
https://www.w3.org/2005/Incubator/webid/spec/identity/
https://datatracker.ietf.org/doc/draft-cavage-http-signatures/
http://openid.net/connect/
https://www.w3.org/2005/Incubator/webid/spec/tls/
https://www.projectcounter.org/
http://www.niso.org/standards-committees/sushi
https://tools.ietf.org/html/rfc7232#section-2.3
E1916
E1989
E419
CA1845
CA1740
CA1512