E1683 – 2015年IIPC総会<報告>

カレントアウェアネス-E

No.283 2015.06.25

 

 E1683

2015年IIPC総会<報告>

 

 ウェブアーカイブに関する連携を目的とした組織である「国際インターネット保存コンソーシアム(IIPC;CA1664参照)」の総会が,2015年4月27日から5月1日まで,米国カリフォルニア州にあるスタンフォード大学とインターネット・アーカイブを会場にして開かれ,世界各国の図書館員やアーキビスト,研究者等約200名が参加した。ウェブアーカイブを利用した研究の成果やIIPCが進めるプロジェクトの最新情報等について報告があり,活発な議論が交わされた。

 報告の内容は多岐にわたったが,議長のワーグナー(Paul Wagner)氏(カナダ国立図書館・文書館)が「最近の議論の焦点はウェブアーカイブの利活用に移ってきている」と指摘したように,ウェブアーカイブの,特に研究利用という視点からのものが目立った。

 英国の“Big UK Domain Data for the Arts and Humanities(BUDDAH)”プロジェクトは,その代表的な取り組みの一つである。これは,英国図書館(BL)やロンドン大学のInstitute of Historical Research等が共同で進めているもので,アーカイブされたUKドメインのウェブ情報をデータセットとして,それらを人文学分野でどのように活用できるかという分析の理論的・方法論的枠組みを構築することを目指している。一般公開された総会初日,プロジェクトに携わる3名から,その詳細や進捗状況が報告された。

 Institute of Historical Researchのウィンターズ(Jane Winters)氏によれば,ウェブアーカイブが有する資料としての価値に光をあてることが,このプロジェクトの狙いの一つである。研究者からは,有用な資料を発見するための高機能な検索インターフェースが求められているという。その一方で,人文学の研究者は定量的手法を用いた調査に不慣れであるという点も指摘された。続いて,BLのHelen Hockx-Yu氏から,ウェブアーカイブ向けの検索ツール“Shine”のプロトタイプについて説明があった。“Shine”は,研究者の要望をもとにした高度な全文検索やファセットによる絞り込み機能を備えており,ある言葉の出現頻度が測定できる「トレンド分析」等も行える。研究者からのフィードバックを受け,今後も改良を続けるという。Oxford Internet Instituteのコールズ(Josh Cowls)氏からは,“.uk”ドメインにおける“.co.uk”や“.ac.uk”といったセカンドレベルドメインの構成比の変遷や,それらの相互リンク関係についての調査結果等,研究成果の一部が報告された。

 研究利用のためには,研究者にとって利用しやすい形でデータセットを提示することもまた重要である。この点に関しては,複数の報告において“Web Archive Transformation”(WAT)ファイルの有用性が指摘された。WATは,ウェブアーカイブの保存用フォーマットであるWARC形式のファイルからURLやHTMLのメタデータを抽出したファイルである。ファイルサイズはWARCの18%以下と小さく,扱いやすいという特長がある。アーカイブしたコレクションの中に,どのような種類のファイルがどれくらい含まれているかということを収集月別にグラフ化したものなど,WATファイルを使ったデータ分析事例がいくつも紹介された。

  研究利用に焦点が当たったのは今回の総会が初めてではなく,むしろ,数年前からIIPC加盟機関の間で共有されてきた課題である。こうした課題に対し,各機関が積極的に取り組み,具体的な成果が生み出されつつあることがうかがえた。とはいえ,その道のりは決して平坦なものではない。それだけに,2日目に登壇し,現代史研究におけるウェブアーカイブの重要性を語ったウォータールー大学の歴史学者ミリガン(Ian Milligan)氏の「ウェブアーカイブは歴史研究に大きな変革をもたらす」との言葉に,IIPCメンバーの多くが勇気づけられたに違いない。

  コンテンツの収集やコレクション構築についても,引き続き,重要な課題である。テキサスA&M大学のマーシャル(Cathy Marshall)氏は初日の講演で,Facebook等,SNS情報の保存の重要性を指摘した。また,最終日に開かれたコレクション構築(Collection Development)ワーキンググループでは,IIPC加盟機関が共同で第一次世界大戦関連のウェブサイトを収集していくことが確認されたほか,南米や東南アジア,アフリカといった地域の多くにウェブアーカイブの手があまり及んでいないことが課題として取り上げられ,その解決に向けた議論がなされた。

 組織間の連携や情報共有,ツールの開発等,ウェブアーカイブの発展のため,IIPCは重要な役割を果たしている。他方,IIPCの今後に関する議論の中では,研究者を巻き込んだ活動の展開を望む声が多数あがった。現在締結されているIIPC協定は,2015年末で失効する。総会での議論を踏まえ,新協定締結に向けた準備が進められている。

 次回の総会は2016年4月,アイスランドのレイキャビクで開催予定である。

関西館電子図書館課・福嶋聖淳

Ref:
http://netpreserve.org/general-assembly/ga2015-schedule
http://buddah.projects.history.ac.uk/
http://www.webarchive.org.uk/shine/search?facet.sort=index&tab=results
CA1664