E2101 – 2018年IIPC総会・ウェブアーカイブ会議<報告>

カレントアウェアネス-E

No.362 2019.01.31

 

 E2101

2018年IIPC総会・ウェブアーカイブ会議<報告>

 

    国際インターネット保存コンソーシアム(IIPC;CA1893参照)の総会及びウェブアーカイブ会議(WAC;E1819ほか参照)が2018年11月12日から11月15日まで,ニュージーランドの首都ウェリントンにあるニュージーランド国立図書館(NLNZ)で開催された。国立国会図書館(NDL)からは筆者が参加した。NDLからの両会議への参加は2年ぶりである。

    NDLを含むIIPC加盟機関の代表者が参加した12日の総会では,この1年間のIIPCの取組について報告があり,参加者の間で今後の活動方針について議論が交わされた。まず議長を務めるInternet Archive(IA)のベイリー(Jefferson Bailey)氏らから,現在の財政状況や活動費の今後の使途方針について説明があった。また,総会に先立って実施された加盟機関へのアンケート調査の結果概要が紹介された。IIPCの活動に優先順位をつける質問に対しては,過半数が「ツールの開発及び標準化の推進」を第1位に挙げたとのことだった。さらに,「コンテンツ構築」「保存」「研修」の3つのワーキンググループ(WG)のリーダーから,それぞれの活動状況が報告された。加盟機関による近況報告の時間もあり,筆者からは,NDLのインターネット資料収集保存事業(WARP)の英語版インターフェース公開についてアナウンスした。昼食をはさみ,グループディスカッション,そして各WGのワークショップが開かれた。筆者が出席したコンテンツ構築WGはウェブサイトの共同収集を主導しており,グループのリーダーから,2018年平昌冬季オリンピック・パラリンリック関連サイトや世界のオンラインニュースサイトといったコレクションの収集状況等について説明があった。また議論の中で,新規に構築するコレクションとして,気候変動や国際サッカー連盟(FIFA)女子ワールドカップ2019といったテーマが候補に挙がった。

   翌13日から3日間の日程で開かれたWACには,図書館員やアーキビスト,研究者,システム開発者など,IIPC非加盟機関のメンバーも含め,約130人が参加した。識者による基調講演のほか,ウェブアーカイブのためのツール,コンテンツの収集,利活用,法制度等,様々なテーマで約50の発表やワークショップが行われた。

   中でも興味深かったのは,NLNZ,フランス国立視聴覚研究所(INA),フランス国立図書館(BnF)からのTwitterの収集についての成果報告である。Twitterを収集するには大きく2つの方法,つまり,収集ロボットでページをクロールする方法(ウェブクロール)と,APIを利用する方法(APIクロール)があるが,それぞれ長短がある。例えばウェブクロールの場合,通常のウェブサイト収集と同様のワークフローで対応でき,オリジナルと同様の再現が可能である。一方で,収集できるアカウントやツイートに限りがあるほか,動画等が収集できない。APIクロールでは,大規模な収集が可能かつ容易であり,同時に豊富なメタデータも収集できる。しかし,収集したデータを再現するには専用アプリケーションを開発する必要がある。こうした両者の特徴を踏まえ,NLNZとINAはAPIクロールを,BnFはウェブクロールを採用し,Twitterの保存と提供を実現していることが報告された。

   アーカイブツールWebrecorderに関するパネルディスカッションやチュートリアルも,多くの参加者の関心を集めていた。Webrecorderは,ボーンデジタルの芸術や文化の保存に取り組む米国の団体Rhizomeによって開発されたソフトウェアである。各国のウェブアーカイブ機関で広く採用されている収集ロボットHeritrixが苦手とする動的コンテンツの収集にも対応し,オリジナルサイトをより忠実に再現できる。コンテンツが動的に生成されるサイトは近年増えており,それらを適切にアーカイブできる有用なツールとして利用が進むことが予想される。

   制度面においては,英国図書館(BL)のビンガム(Nicola Bingham)氏より,欧州連合(EU)一般データ保護規則(GDPR;E2053参照)と英国の2018年データ保護法へのBLの対応について,報告があった。BL内での検討の結果,コンテンツの取り下げの必要がある場合でも,納本図書館としての役割に鑑み削除はせず,アクセスの停止により対応することを確認したという。また,ウェブアーカイブは個人情報を収集するリスクが高いため,様々なシナリオを想定したガイドラインを準備し,迅速な取り下げ手順の共有を図ったとのことであった。ただビンガム氏は,ガイドラインはスタッフの役に立つものの,それに基づく対応については定期的なレビューをした方がよいとも主張した。

    IIPCは従来,総会の一部のプログラムに一般参加も認める形でウェブアーカイブに関する議論の場を設けてきたが,2016年からは,加盟機関以外にも開かれたWACを総会から独立させて開催している。このことで参加者の裾野が広がり,議論されるテーマもより多様になったように感じられた。一方,総会で紹介されたアンケート結果からも分かるとおり,IIPCにツール開発を望む声は今なお大きい。WARPもその機能をIIPCが手がけるツール(閲覧アプリケーションOpenWayback等)に負うところが大きく,引き続きツール開発に力が入れられることに期待したい。

    次回の総会及びWACは2019年6月,クロアチアの首都ザグレブで開催が予定されている。

関西館電子図書館課・福嶋聖淳

Ref:
http://netpreserve.org/ga2018/
http://netpreserve.org/ga2018/programme/general-assembly/
http://netpreserve.org/ga2018/wac/
https://archive-it.org/home/IIPC
https://webrecorder.io/
http://netpreserve.org/ga2019/
E1819
E2053
CA1893