E2615 – 2023年IIPC総会・ウェブアーカイブ会議<報告>

カレントアウェアネス-E

No.460 2023.07.13

 

 E2615

2023年IIPC総会・ウェブアーカイブ会議<報告>

関西館電子図書館課・志村努(しむらつとむ)

 

  国際インターネット保存コンソーシアム(IIPC;CA1893参照)の総会及びウェブアーカイブ会議(WAC;E2425ほか参照)が、2023年5月10日から12日まで、オランダのヒルフェルスムで、オランダ視聴覚研究所とオランダ王立図書館(KB)の共催により開催された。国立国会図書館(NDL)からは筆者が参加した。本稿では、参加した会合の内容を報告する。

  10日の総会には加盟機関の代表者が参加し、IIPCのプロジェクトリーダー等から1年間の活動報告や各ワーキンググループの今後の活動方針についての報告があった。IIPCでは現在、ウェブサイトの収集及び収集したウェブサイトを表示するためのツール開発に力を入れているとの説明があった。また、特定テーマに関して加盟機関により推薦されたウェブサイトをIIPCが収集する共同収集の取組にも重点が置かれていると報告された。また、新型コロナウイルス感染症の影響から直近3年がオンライン開催となったWACの開催実績が報告された。オンライン参加者数は最大で1,000人に達し、参加の容易さという点ではオンライン開催にメリットがあると述べられた。

  加盟機関による近況報告では、シンガポール国立図書館とデンマーク王立図書館それぞれから各国のドメイン収集(「.jp」などのドメインレベルでのサイト収集)の状況について、KBから同国のドメイン収集に向けたパイロットプロジェクトであるフリジア語(同国北部で使用されている言語)ドメイン収集について報告があった。また、韓国国立中央図書館からは、災害関連のウェブサイト収集や公的機関のTwitter収集について報告がなされた。ドメイン収集やSNS収集の報告から、各国がウェブアーカイブの収集範囲を広げていく動向がうかがえた。

  10日の夕方からは、公開イベントとしてデジタル遺産の共同構築についてパネルディスカッションが行われた。テーマとなったのは、ユネスコが歴史上の重要な記録物を登録する「世界の記憶」(CA918参照)である。オランダでは、同国のインターネット初期のプロパイダが提供していたホームページのウェブアーカイブが2022年に「世界の記憶」に登録されたほか、初期のオンラインコミュニティをデジタル遺産として保存する試みが同国内の複数の文化機関において進行しており、現在登録申請中であると報告された。インターネット初期の様相は歴史上重要な記録であるため、パネラーの間では、ウェブアーカイブとして後世に残しておくべきものであるという認識で一致した。

  11日から12日までのWACには、IIPC非加盟機関からも含め、図書館員やアーキビスト、研究者、システム開発者等、約300人が参加した。調査情報サイトBellingcatのヒギンス(Eliot Higgins)氏等による基調講演をはじめ、ウェブアーカイブのためのツール、コレクション構築、SNS収集等、様々なテーマで約30の発表やパネル、ワークショップが行われ、活発な議論が交わされた。当日は、複数のセッションが並行して同時に進められた。

  SNS収集における共同アプローチのセッションでは、ベルギーのルーヴェンにある研究機関KADOCが進めているSNS収集について報告が行われた。収集における最大の課題は、SNSのプラットフォーム企業がユーザに課している技術的な制約だという。つまり、SNSによってはユーザデータの収集を困難にするためIPアドレスでのアクセス制御等の技術的な対策がされている場合があり、それは一機関だけの取組で解決できる課題ではないとされた。また、オランダとベルギーの複数のウェブアーカイブ機関によるSNSの分散型共同収集アプローチの可能性調査についての報告も行われた。そこでは、図書館、地域の公文書館、研究機関等の42機関にインタビュー等を行った結果から、図書館と研究機関といった異なる機関種別がSNS収集を共同実施することと、異なる国の図書館といった特定の機関が国際的に共同することはアプローチの仕方が異なるため、それぞれの成功事例が必要であることが判明したと報告された。

  品質保証のセクションでは、英国国立公文書館(TNA)から再現性確認のプロセスの自動化について報告があった。ウェブアーカイブにおける品質保証は、実際にアーカイブを閲覧し再現性を確認する必要があり、これは非常に人手のかかる作業である。TNAではその作業の負担を減らすため、一部をツールにより自動化し、そのツールをオープンソースとして公開していることが紹介された。また、米国議会図書館(LC)からは、アーカイブ対象である元のウェブサイトとアーカイブしたウェブサイトとの類似性を評価する指標についての報告があり、視覚的類似性、メニューの開閉のようなユーザ操作に対する反応の類似性である相互作用類似性、完全性の3点を指標として設定し、実際にLCの数十人の職員が評価を行った結果が示された。コレクションごとに結果に違いがあり、特にオープンアクセス資料を提供するサイトでは類似性の評価が低い(つまり、うまく再現できていない)という特徴がみられたと述べられた。

  コレクション構築のセクションでは、フランス国立図書館(BnF)から20年にわたって構築してきた選挙コレクションについて報告があった。BnFでは、選挙に関するウェブサイトのクロールを実施するたび、SNS等のウェブの技術進化に対応したクロール技術の導入を検討したということである。また、コレクション構築の過程では、選挙に関連するウェブサイトを選定するキュレータ同士のネットワーク構築の重要性を認識でき、またコレクション構築を継続することは図書館外に対するウェブアーカイブの普及活動にもつながったと述べた。

  SNSをはじめとするウェブの技術進化に対応するため、ウェブアーカイブには常に技術的な課題がある。しかし、ウェブアーカイブに先進的に取り組んでいる国々ではそのような課題に果敢に挑戦し、SNSを含めた幅広いコレクション構築を志向して実際に収集を始めている。そのことを強く印象付けた会合であった。

  次回のIIPC総会及びWACは、2024年4月にフランス・パリで開催される予定である。

Ref:
“General Assembly”. IIPC.
https://netpreserve.org/general-assembly/
“GENERAL ASSEMBLY & WEB ARCHIVING CONFERENCE 2023”. IIPC.
https://netpreserve.org/ga2023/
前田直俊. ウェブアーカイブの利活用に向けた動き-世界の潮流とWARPの取組-. カレントアウェアネス. 2017, (331), CA1893, p. 9-13.
http://doi.org/10.11501/10317594
髙峯康世. 2021年IIPC総会・ウェブアーカイブ会議<報告>. カレントアウェアネス-E. 2021, (420), E2425.
https://current.ndl.go.jp/e2425
安江明夫. 「世界の記憶」:ユネスコの新規プログラム. カレントアウェアネス. 1994, (173), CA918.
https://current.ndl.go.jp/ca918