E1933 - NDL,2016年度電子情報の長期保存に関する調査報告書を公開

カレントアウェアネス-E

No.328 2017.07.06

 

 E1933

NDL,2016年度電子情報の長期保存に関する調査報告書を公開

 

 国立国会図書館(NDL)は,2017年5月,ウェブサイトにて『恒久的保存基盤の構築に向けた技術調査報告書』を公開した。

 昨今の国内の政策動向として,現在はもちろん,未来の利用者が意思決定や価値の創造に活用できるような「深化型知識インフラ」実現への提言や「ナショナルアーカイブ」の構築に向けた取組の推進がある。それらを踏まえ,NDLは2016年度から,国内関係機関とも連携しつつ,電子情報の恒久的なアクセスを保証する「恒久的保存基盤」の構築に向けた,電子情報の長期利用保証に関する調査研究を行っている。2016年度は,恒久的保存基盤の構築に必要と想定される技術要素について,海外の研究動向を中心に文献調査を行い,報告書をとりまとめた。以下では,報告書の概要を紹介する。

●恒久的保存基盤について

 電子情報の長期利用を保証するためのシステムインフラとして,恒久的保存基盤の構想とその機能について提示した。恒久的保存基盤の構想は,電子情報の長期保存についての国際標準であるOAIS参照モデル(CA1489参照)を参考として,複数の機関が共同して分散保存を実現し,保存した電子情報を利用する際に必要な再生環境などの情報を長期保存知識ベースとして構築することを目指している。

 恒久的保存基盤の構築に必要な技術要素として,以下の4つの要素を提示し,次に国立国会図書館サーチの運用で実績のある(1)以外の(2),(3),(4)について,文献調査を行った。

  • (1)電子情報資源の書誌的情報を記載する記述メタデータと所在情報の集約(複数のアーカイブシステムからの記述メタデータと所在情報の収集)
  • (2)分散保存(OAISに準拠したアーカイブシステム,情報パッケージの標準化,アーカイブ間でのコンテンツ交換プロトコル)
  • (3)長期保存知識ベース(長期保存に必要な情報を記述する保存メタデータ,フォーマットレジストリ)
  • (4)利用提供(メタデータ利活用のためのAPIの提供,コンテンツアクセスのプロトコルやAPIの標準化,権利情報を踏まえたアクセス制御機能)

●海外の研究動向調査

・分散保存
 実際にOAISを採用して構築されたアーカイブとして,ドイツのベルリン・コンラート・ツーゼ情報技術センター(ZIB)のDigital Preservation System(DPS),フランス国立図書館(BnF)のリポジトリSPAR(Scalable Preservation and Archiving Repository)を調査した。また,分散型アーカイブのOAISへの適用について,連携する各機関をそれぞれOAISの一つのエンティティとして扱い,OAISを入れ子にした構造を提案しているOuter OAIS-Inner OAIS(OO-IO:外面-内面OAIS)モデルを紹介した。

 OAISでは,コンテンツと長期保存のための情報をまとめて「情報パッケージ」として扱う。分散保存のために必要な情報パッケージの標準化やリポジトリ間でのコンテンツ交換の取組として,米国のTowards Interoperable Preservation Repositories(TIPR)やLOCKSS(Lots of Copies Keep Stuff Safe)を調査した。また,複数機関が参加する米国の長期保存プロジェクトであるChronopolisモデルや,ストレージにクラウドサービスを利用しているニュージーランド国立図書館の取組についても調査した。

・長期保存知識ベース
 情報パッケージの標準化と合わせて,データへのアクセス性と再利用性を保証するため,長期保存に必要とされる保存メタデータを調査した。コンテンツの利活用に必要とされるファイルフォーマット情報を蓄積するフォーマットレジストリについては,米国の統合デジタルフォーマットレジストリ(Unified Digital Format Registry:UDFR)プロジェクトを調査した。また利活用事例として,複数機関でエミュレーション技術を共有するEmulation as a Service(EaaS)を紹介した。

・利用提供
 図書目録のようにコンテンツに付随する記述メタデータの利活用に向けて,永続的識別子を用いた相互リンクの実現に向けた取組や,OAI-PMH(CA1513参照)の後継プロトコルとされるResourceSync(CA1845参照)について調査した。コンテンツへのアクセスに関しては,主に画像ベースのリソースに用いられるIIIF(International Image Interoperability Framework)や,ボーンデジタルのアーカイブ資料へのアクセスソリューションの開発を目指したE-ARK(European Archival Records and Knowledge Preservation)プロジェクトについて調査した。

 本報告書は技術要素の観点から海外文献調査を行ったが,今後も恒久的保存基盤の実現に向け,継続して調査を実施する予定である。

電子情報部電子情報サービス課次世代システム開発研究室・里見航

Ref:
http://www.ndl.go.jp/jp/aboutus/dlib/preservation/research.html
http://dl.ndl.go.jp/info:ndljp/pid/10356061
https://public.ccsds.org/pubs/650x0m2.pdf
E1204
E1863
CA1489
CA1513
CA1845
CA1561
CA1690