E729 – カナダ国立図書館・文書館が政府ウェブサイトのアーカイブ公開

カレントアウェアネス-E

No.119 2007.12.12

 

 E729

カナダ国立図書館・文書館が政府ウェブサイトのアーカイブ公開

 

 カナダ国立図書館・文書館(LAC)は2004年にウェブ・アーカイブを制度化し(E226参照),その規程に基づいて2005年12月からカナダ連邦政府のウェブサイトの収集に着手した。2006年12月には,政府ウェブサイトのアーカイブがLACの閲覧室で提供されるようになったが,このほど“Government of Canada Web Archive(GCWA)”としてウェブ上でも公開を開始した。現時点でおよそ1億件のデータ(容量は4テラバイト以上)が保管されており,キーワードのほか,日付,ファイルタイプ(画像,ビデオ,PDFなど),省庁名,URLなど複数のパターンで検索を行うことができる。今後も資金が許す限り,年2回のペースでデータ収集が実施されていく予定だという。

 なおLACは,英国図書館(BL),米国議会図書館(LC),フランス国立図書館(BNF)など欧米の11の国立図書館とInternet Archiveにより2003年に結成された,国際インターネット保存アーカイブ(International Internet Preservation Consortium:IIPC)の一員であり(CA1537参照),「ウェブ・アーカイビングのための相互運用可能なツールや技術の開発を通じたコンテンツの収集,保存,長期にわたるアクセスの保障」というコンソーシアムの目標のために尽力している。今回のGCWAのシステム構築の際にも,IIPCが開発した3種類のオープンソースソフトウェア(Heritrix v1.12.1,NUTHCHWAX v0.10.0,WAYBACK v0.8.0)が使用されたという。

 LACは2004年のウェブ・アーカイブの法制化に引き続き,法定納本制度を改正し,2007年1月よりオンライン出版物を納本対象としている(E606参照)。オンライン上の情報源を国が保存していくべき知的財産とみなし,収集・保存していこうという動きが世界中で活発化している中でも,LACの活動は注目に値するだろう。

Ref:
http://www.collectionscanada.ca/whats-new/013-315-e.html
http://www.collectionscanada.gc.ca/webarchives/index-e.html
CA1537
E226
E606
E656