E1639 – 米国のウェブアーカイブの現状と課題

カレントアウェアネス-E

No.273 2014.12.24

 

 E1639

米国のウェブアーカイブの現状と課題

 

 米国国家デジタル管理連盟(National Digital Stewardship Alliance)が,米国のウェブアーカイブ実施機関を対象にアンケート調査を実施し,報告書“Web Archiving in the United States: A 2013 Survey”として取りまとめた。本調査は,米国におけるウェブアーカイブ活動の現状を把握することを目的としている。

 なお,同連盟は2011年にも同様の調査を行っており,今回は2回目の調査となる。前回調査と類似の設問も多くあり,両者の比較が報告書の中心的な内容となっている。

 今回調査に参加した機関は92機関で,その内訳は大学等の教育機関が52%,公文書館・資料館が15%,州政府機関が13%となっている。そのほか,連邦政府機関や少数ながら営利団体も参加している。前回調査と比べ,参加数は77機関から92機関へと増加しているが,機関別内訳にはほとんど変化がない。

 アンケート調査では,以下の五つのトピックエリアにわたる,27の設問が用意された。
・調査参加機関についての情報
・ウェブアーカイブ事業の概要(コレクション内容,アーカイブ開始時期,スタッフ数など)
・アーカイブポリシー(収集先サイトの同意有無,robots.txtの遵守,著作権など)
・ツール,サービスについて(自主構築のシステムか,Archive-it等の外部委託サービスを利用しているか,収集データのストレージについてなど)
・コレクションへのアクセス(ビューワーや検索システムについて)

 アーカイブ事業の現状については,全体として非常に肯定的な認識がなされている。過去2年間で,38%の機関が新規に事業を開始し,また7割を超える機関で,かなりの,またはある程度の進歩を遂げたとしている。

 五つのトピックエリアの中では,アーカイブポリシーの項目が興味深い。

 たとえば,収集先サイトに対して何らかの同意を得るか否かは,収集については58%が相手先サイトに対し事前通知も許諾依頼も行っていない。これに対し,収集ロボットのアクセスをそのサイトが受け入れるか排除するかを記述する,“robots.txt”については,55%が遵守すると回答している。これは,前回調査の33%から20%の増加である。

 また,7割近くの機関で,「生きている(現在更新中の最新の)」サイトとの混乱を防ぐため等の理由で,6か月から1年程度の公開猶予期間を設けていた。  このほか報告書では,今回の調査で明らかになった,以下のような事実に着目している。

・ウェブアーカイブ事業の共通規格化・標準化が進む方向にあること。
 技術的な面で言えば,WARCフォーマットやWaybackビューワーといった標準的な規格を採用する機関が目立って増加している。運営ポリシーに関しても,半数以上の機関で著作権やデータ提供の方針の策定に際し,別の機関の同種の規程を参照している。これらは,アーカイブが特定の方向へ収斂していくことを示すものである。

・協同アーカイブの可能性
 3分の1以上の機関が,協同アーカイブへの参加に興味を持っているものの,実際の事業参加には至っていない。協同アーカイブへの潜在的な参加ニーズは高いと考えられ,今後,様々な試みがなされることが予想される。なお,すでに作成された協同アーカイブの例としては,ウクライナ紛争,2010年冬季オリンピックに関するものがある。

・収集及び利用拡大への挑戦
 事業評価の指標として重視されているのは,データ収集量,利用状況,コストといった項目である。このことから,効率的なデータ収集や,収集したデータの保存方法,アーカイブの利活用の方法などが,今後の重要な検討課題となっていくことが予想される。

 また,次回調査でより深く調査すべき,いくつかのポイントも指摘された。

 ウェブアーカイブにおける外部委託サービス機関との役割分担はその一つである。調査結果からは,多くの機関でソーシャルメディアや動画等の収集に関して技術的困難を抱えていることが判明した。また,ほとんどの機関で専任スタッフがいないことを考えると,こうした課題の解決は,外部機関へのサービス委託に期待せざるを得ない。また,システム関連の設備をインハウス(自組織内)で構築する機関が大きく減少していることも,外部委託サービス機関の役割拡大を示すものである。

 このほか,コレクション検索ツールについて,今回の調査では,書誌データを作成する機関が前回から大幅に減少し,全体の4分の1を下回った。同時に,今回新たに選択肢に加わった”finding aids”(検索補助手段)を採用している機関が20%に上っている。この結果について,書誌作成が本当に下火になっているのか,あるいは選択肢の作り方に影響されたものなのか。さらなる調査によって実態を見極める必要がある,と報告書は述べている。

関西館電子図書館課・松原由美子

Ref:
http://www.digitalpreservation.gov/ndsa/working_groups/documents/NDSA_USWebArchivingSurvey_2013.pdf
http://blogs.loc.gov/digitalpreservation/2014/10/results-from-the-2013-ndsa-u-s-web-archiving-survey/
http://www.digitalpreservation.gov:8081/ndsa/index.html
https://archive-it.org/collections/4399
http://webarchives.cdlib.org/a/2010olympics/about
https://archive.org/details/ExampleArcAndWarcFiles