米国議会図書館(LC)、新たに4,240件のウェブアーカイブを公開:メタデータの自動付与を実施

2018年8月3日、米国議会図書館(LC)が、43のイベントとテーマコレクションからなる4,240件のウェブアーカイブを新たに公開したと発表しています。

今回公開されたものの中には、2002年から現在までのオンラインマガジン『スレート』誌や、スリランカの現職大統領の選挙キャンペーンのウェブサイト等が含まれています。

ウェブアーカイブの規模が拡大したことから、利用可能となるまでの時間を維持するため、ウェブアーカイブの目録作成にあたり、目録担当者の能力とプログラミング言語(Python)を組み合わせた、記述メタデータのスキーマMODSに基づいたレコード(簡略版のMODS)を自動的に生成する手法が用いられています。

More Web Archives, Less Process(LC,2018/8/3)
https://blogs.loc.gov/thesignal/2018/08/more-web-archives-less-process/

Archived Web Site (LC)
https://www.loc.gov/websites/

参考:
米国議会図書館、連邦裁判所のウェブアーカイブ“Federal Courts Web Archive”を公開
Posted 2017年9月29日
http://current.ndl.go.jp/node/34752

米国議会図書館、国際法廷に関するウェブアーカイブ“International Tribunals Archive”を公開
Posted 2017年6月21日
http://current.ndl.go.jp/node/34212

米国議会図書館、ウェブコミックとインターネット文化に関するウェブアーカイブを公開
Posted 2017年6月14日
http://current.ndl.go.jp/node/34168