カレントアウェアネス-E
No.161 2009.11.18
E995
IIPCオープンミーティング及びワーキンググループ<報告>
第6回電子情報保存に関する国際学術会議(iPRES2009;E990参照)の共催会議の一つとして,IIPC(CA1664参照)オープンミーティングが,米国サンフランシスコのミッションベイ・カンファレンスセンターを会場として,約150人の参加者を集めて,2009年10月7日に開催された。また10月8日に同会場で,IIPC加盟機関による「保存」及び「提供」ワーキンググループ(WG)が開催された。国立国会図書館(NDL)からは筆者が参加した。
IIPCオープンミーティングは,「IIPCによる,インターネット情報を保存するための積極的な解決策(IIPC Active Solutions for Preserving Internet Content)」をテーマとして,ウェブアーカイブの長期保存に焦点をあてた内容を主とした報告等が行われた。基調講演は,InternetArchive(E751参照)の代表であるケール(Brewster Kahle)氏が行った。ケール氏は,ウェブアーカイブがたとえ長期保存されても,利用に供されない「ダークアーカイブ」では意味がなく,常に利用を前提とした保存を考えることが重要であることを強調した。基調講演後,ウェブアーカイブ用保存フォーマットWARC(E947参照)の概要や,米国議会図書館,フランス国立図書館(BnF),オーストラリア国立図書館等のウェブアーカイブの保存の取組みについて,各館の実務者による報告やパネル・ディスカッションがなされた。
WGでは,2010年5月の次回IIPC総会(開催地シンガポール)に向けて取り組む作業項目を決定した。「保存」WGでは,BnFがリーダーとなり,「保存」WGに参画する数機関を対象に,当該機関のウェブアーカイブに含まれる文書や画像の保存フォーマットの実態調査を実施すること等が決まった。また,「提供」WGでは,NDLが進めている,IIPCが開発した全文検索エンジン NutchWAX(CA1664参照)を欧米言語圏以外でも利用可能とする機能改良の取組みについて,筆者が中間報告を行った。この取組みは,2008年5月にNDLが「提供」WG に参画して以来,IIPCと情報交換の上,独自に進めてきたもので,今回,「提供」WGの作業項目の一つとして正式に認められた。
NutchWAXは,IIPCの欧米言語圏の加盟機関であるBnFや英国図書館等において,ウェブアーカイブの全文検索サービスを提供するために利用されている。しかし,非欧米言語で記述されたウェブアーカイブについて利用するためには,検索結果等の表示画面の文字化けの解消やノイズが少なく精度の高い検索結果を実現するための機能改良が必要である。これらの課題に対処するための第一歩として,NDLはNutchWAXの核となるテキスト文書検索モ ジュールNutchについて,日本語環境で利用可能とする機能改良に成功した。IIPCが開発したウェブアーカイブ用ソフトウェアの多言語対応は,特にIIPCがNDLに期待しているものである。次回総会に向けて,NDLは中国語等の日本語以外の非欧米言語についても利用できるよう,NutchWAXのさらなる機能改良に取り組んでいく予定である。
(関西館電子図書館課・柴田昌樹)
Ref:
http://www.netpreserve.org/events/about.php
http://archive-access.sourceforge.net/projects/nutch/
CA1664
E751
E947
E990