E1470 – リポジトリデータを未来へ:デジタル保存ネットワークの取組

カレントアウェアネス-E

No.243 2013.08.29

 

 E1470

リポジトリデータを未来へ:デジタル保存ネットワークの取組

 

 2013年の年初に,米国議会図書館(LC)のデジタル保存に関するブログ“The Signal”に,前年のデジタル保存事業の進展の10大ニュースが掲載された。この中の1つとして,デジタル保存ネットワーク(Digital Preservation Network:DPN)の設立が挙げられた。DPNの目指すものは,高等教育機関が共同して,デジタル学術情報やデジタル化資料,研究データ等様々なデジタル情報を長期に確実に保存することである。2012年初めの設立時において全米の50以上の機関が参加している。

 米国の図書館界では,デジタル情報の長期保存を意識した取組が進められてきた。各機関の機関リポジトリ,コンソーシアムで進められているHathiTrust(E1406CA1760参照)やCLOCKSS(E1117参照),ITHAKAのPortico(E1236参照)などである。DPNは,これらの取組を踏まえつつ,それだけではまだ不十分だとして,これらの取組の全体を協調させる仕組を構築することを目指している。堅牢のように見える保存システムも,システム障害のみならず,政治的な背景や財政難,あるいは自然災害等の状況により,データ喪失の危機に瀕することが懸念される。そのような不測の事態が起こってもなお復元可能な仕組みを整備しようというのである。

 DPNのシステムは,基本的には,既存の大規模な保存リポジトリを“ノード”(結節点)として,これらをネットワーク化したものである。開始時においてノードとなるのは,HathiTrust,Chronopolis,スタンフォードデジタルリポジトリ(Stanford Digital Repository:SDR),テキサス大学デジタルリポジトリ(University of Texas Digital Repository:UTDR),Academic Preservation Trust(APTrust)の5つであり,地理的にも組織的にも財政的にも技術的にも異なる枠組みで運営されているこれらのノードが,全体としてコンテンツを保存するダークアーカイブとして機能するという構想である。

 このうちAPTrustは,米国の11大学と,DSpaceやFedoraの維持を行っている非営利組織DuraSpace(E956E1459参照)のコンソーシアムにより現在構築が進められているリポジトリであり,保存を主眼としたものである。またカリフォルニア大学サンディエゴ校サンディエゴ・スーパーコンピュータセンターのChronopolisとテキサス大学のUTDRも,保存を主眼にしたリポジトリである。HathiTrustやスタンフォード大学のSDRは保存とアクセスの両方を兼ね備えたリポジトリといえる。これらのリポジトリの技術者が,DPNの技術チームのメンバーとなり構築を進めている。

 システムが構築された後の運用としては,DPNのメンバーがデジタルコンテンツを1つのノードに登録すると,それが複製され他のノードにも共有され,保存される形が想定されている。DPNを利用するメンバーは,それぞれのノードと契約を締結してサービスレベルを決定し,その上でコンテンツの登録を行うことになる。契約文書については,現在合意書の案の作成が権利継承ワーキンググループ(Succession Rights Working Group)により進められている。登録者とリポジトリ,リポジトリとDPNとの間の2種類の文書の作成が進められており,これらに将来的な保存とアクセス可能性を保証するために必要な要素が盛り込まれるよう検討されているもようである。文書は年内に完成させることが目指されている。

 スタンフォード大学のクレイマー(Tom Cramer)氏やカリフォルニア大学サンディエゴ校のマイナー(David Minor)氏ら4名はDPNを概説するペーパー“The Case for Building a Digital Preservation Network”を著し,DPNがメンバーにもたらす恩恵について以下の6つにまとめて説いている。すなわち(1)アーカイブのためのアーカイブとして機能することによる「復元力」,(2)コンテンツの提供元が解体してもなお継続してコンテンツが利用できるようにする「継承」,(3)個々のメンバーのレベルでは経済的負担を許容できるレベルにする「規模の経済」,(4)個々のリポジトリが保存環境を構築する負担を軽減する「効率性」,(5)保存に影響を及ぼす環境変化に応じ得る運営面・技術面・法律面の「拡張性」,(6)伝送時及び保管時のデータの「安全性」,である。

 この様な恩恵が現実のものとなるか否かはこれから明らかになることだが,個々のリポジトリに蓄積されたデジタル学術情報やますます増え行く様々なデジタル情報を,長期にわたりより確実に保存し,将来世代に引き渡していくことを考える時,それを必要とする人・組織が新たな負担を負うことは避けられないにように思われる。その中で,DPNが進める既存の保存リポジトリの協調を目指す取組は,引き続き注目を要するものだと思われる。

(関西館図書館協力課・依田紀久)

Ref:
http://blogs.loc.gov/digitalpreservation/2013/01/top-10-digital-preservation-developments-of-2012/
http://www.educause.edu/ero/article/case-building-digital-preservation-network
http://www.cni.org/topics/digital-preservation/the-digital-preservation-network-a-report-and-discussion-on-dpns-emerging-architecture-system-protocol-service-model/
http://www.dpn.org/wp-content/uploads/2013/06/DPN_MAR_2013.pdf
http://www.dpn.org/wp-content/uploads/2013/06/DPN_MAY_2013.pdf
E956
E1117
E1236
E1459
CA1760