オランダデジタル遺産ネットワーク、動的コンテンツを含むウェブサイトの収集手法を調査したレポート“Server-Side Web Archiving”を公開

英・デジタル保存連合(DPC)は、2021年6月14日付けのお知らせで、オランダデジタル遺産ネットワーク(The Dutch Digital Heritage Network:DDHN)が新たなレポート“Server-Side Web Archiving”を公開したことを紹介しています。レポートの筆者は、オランダ視聴覚研究所のEoin O’Donohoe氏です。

同レポートでは、動的コンテンツを含むウェブサイトの収集手法を調査しています。ウェブアーカイブサービスConifer(以前の名称はWebRecorder)、実験・作業の再現を可能にするためのツールReprozipを使用し、実際に2つのウェブサイトを対象に収集テストを行い、その結果と推奨事項をまとめています。

DPCのお知らせでは、同レポートの内容に基づき、ウェブサイト収集の現状と問題点を説明しています。ウェブ技術の進展に伴い動的コンテンツを使用したウェブサイトが増加していることに触れ、クローリングによる静的コンテンツの大規模収集という、これまで遺産機関が採用してきた収集戦略では、ウェブサイトの最も外側の層しか収集できないと指摘しています。その上で、動的コンテンツ収集のためには、現在のクローリング手法ではなく、ウェブサイトの構築者・管理者に連絡を取りサーバーからファイルを受け取る「サーバーサイド」アプローチへの注目が必要であると述べています。

New Report: Archiving the dynamic web benefits from server-side archiving(DPC, 2021/6/14)
https://www.dpconline.org/news/server-side-archiving

Archivering van het dynamische web gebaat bij archiveren serverzijde(DDHN, 2021/6/1)
https://netwerkdigitaalerfgoed.nl/nieuws/archivering-van-het-dynamische-web-gebaat-bij-archiveren-serverzijde/

Server-Side Web Archiving(Zenodo, 2021/6/1)
https://doi.org/10.5281/zenodo.4889460

参考:
デジタルアートの保存に取り組む米国の団体Rhizome、ウェブアーカイブサービスWebrecorder.ioの名称を“Conifer”に改称
Posted 2020年6月16日
https://current.ndl.go.jp/node/41234

E2182 – 2019年IIPC総会・ウェブアーカイブ会議<報告>
カレントアウェアネス-E No.377 2019.10.10
https://current.ndl.go.jp/e2182

E2322 – オランダ・ILP Labによるウェブサイト収集への提言
カレントアウェアネス-E No.402 2020.11.12
https://current.ndl.go.jp/e2322