ウェブアーカイブ

フランス国立図書館、ウェブアーカイブを館内限定で公開

フランス国立図書館(BnF)が、館内(フランソワ・ミッテラン館内調査研究用図書館レ・ド・ジャルダン)限定でウェブアーカイブを公開したと発表しています。これは2006年の法制化に基づき、.frドメイン、および、.frドメイン以外でフランス人あるいはフランス国内で作成されたウェブサイトを優先し、選択的にロボットで収集したもので、2004年から毎年Internet Archiveと協同で大規模に収集しているコレクションと、2007年の大統領選挙・議会選挙など特定のトピックについて、担当のライブラリアンがチェックした特定のサイトをより高頻度でより完全に収集したコレクションの2つからなる、とされています。

なお2008年4月時点で、BnFが収集したファイルは130億点に達しているとのことです。

BnF-Collections : Archives de l'Internet

E861 - 第8回国際ウェブアーカイビング・ワークショップ<会議報告>

第8回国際ウェブアーカイビング・ワークショップ(IWAW;CA1664参照)が,デンマークのオーフス大学を会場として,2008年9月18日から19日の2日間にわたり開催された。この会議は第12回電子図書館研究及び先端技術に関する欧州会議(ECDL;E853参照)のワークショップのひとつとして行われた。…

ブログや動画のメタデータのみを収集するウェブクローラー“ContextMiner”

米国議会図書館(LC)の全米デジタル情報基盤整備・保存プログラム(NDIIPP)の助成のもと、ノースカロライナ大学チャペルヒル校が、ウェブ上のブログ・動画のメタデータのみを収集するクローラー“ContextMiner”を開発・公開しました。

ContextMiner
http://www.contextminer.org/

ContextMiner: A Metadata Collection Tool
http://www.digitalpreservation.gov/news/2008/20081106news_article_contextminer.html

ちなみに同校は、NDIIPPの助成によるプロジェクト“VidArch”のもと、YouTubeの動画をクロールする“TubeKit”など、他のツールも開発しています。

ニュージーランド国立図書館、10月に国内ウェブサイトの一括収集を実施

ニュージーランド国立図書館が、2008年10月に国内のウェブサイト(.nzドメインおよび調査した結果国内で運用されていると判明した200程度のウェブサイト)、推計1億URLを、画像、動画等も含めて一括でハーベスティングすると発表しています。すでに、10月1~4日にかけてテストを、また7~24日にかけて収集を行っているとのことです。その後、品質確認とテストを行い、11月7日まで追加でクロールを行うとしています。

New Zealand Web Harvest 2008
The National Library is harvesting a copy of the New Zealand internet. The harvest will take place during October 2008.

E847 - IIPCのウェブストーミング・セッション開催される<会議報告>

国際インターネット保存コンソーシアム(IIPC;CA1664参 照)のウェブストーミング・セッション(「ウェブストーミング」はブレーンストーミングからの造語)が,デンマークのオーフス州立・大学図書館を会場とし て,2008年9月16日から17日の2日間にわたり開催された。参加者数は,24機関41名(加盟候補1機関1名を含む)であり,国立国会図書館 (NDL)からは筆者が参加した。

ウェブサイトのハーベスティングソフトをOCLCが提供

大学や文化遺産を取り扱う機関向けに、ウェブサイトを収集、保存するソフトウェア“Web Harvester”を提供すると、OCLCが発表しています。収集したウェブサイトは、OCLCが提供する電子コレクション・マネジメントソフトウェア“CONTENTdm”上で管理できるとのことです。

OCLC's new Web Harvester captures Web content to add to digital collections
http://www.oclc.org/news/releases/200829.htm

Web Harvester
http://www.oclc.org/webharvester/

E751 - ウェブアーカイビングの現在と展望 <報告>

国立国会図書館(NDL)では,2008年1月23日に「ウェブアーカイビングの現在と展望−国際的連携に向けて−」と題する,講演とディスカッションの会を開催した。ウェブアーカイブを中心とするデジタルアーカイブ全般について,国際的活動を繰り広げる有識者が講演を行った。 始めに,NDLから…

カナダ国立図書館文書館、カナダ連邦政府のウェブ・アーカイブを公開

カナダ国立図書館・文書館(LAC)は11月20日から、カナダ連邦政府のウェブアーカイブのウェブ上での公開を開始したと発表しています。LACに設置されている“Government of Canada Web Archive (GCWA)”から閲覧ができ、キーワード、省庁名、URL、ファイルタイプなどで検索することもできるそうです。
カナダ連邦政府のウェブアーカイビングは2005年12月から始まり、2006年12月からはLAC館内で公開が始まりました。ウェブサイトは年に2回の割合でアーカイビングされ、収集したデータはすでに約1億件に達し、容量も4テラバイトを突破しているそうです。

LAC's Government of Canada Web Archive
http://www.collectionscanada.ca/whats-new/013-315-e.html

Government of Canada Web Archive

カナダ国立図書館・文書館、政府ウェブアーカイブを公開

カナダ国立図書館・文書館(LAC)が、カナダ政府のウェブサイトのウェブアーカイブを閲覧室で公開するようになったとアナウンスしています。

カナダは2004年にウェブアーカイブの制度化を図っていますが、その規程に基づいて約1500の政府系サイト(.gc.ca)および地方政府のサイトを収集しているそうです。

現在は閲覧室での利用に限っていますが、今後はインターネットを通した公開も考えているようです。

Government of Canada Web Archive
http://www.collectionscanada.ca/whats-new/013-278-e.html

参考:
E226 (No.41) - カナダ図書館・公文書館が発足
http://www.dap.ndl.go.jp/ca/modules/cae/item.php?itemid=232

カナダ2006年総選挙のウェブアーカイブ

カナダ国立図書館文書館が、1月に行われた総選挙関連のウェブサイトをアーカイブして公開しています。Election 2006 - Harvested Web siteshttp://www.collectionscanada.ca/collection/003-100-e.htmlカナダ国立図書館文書館が、1月に行われた総選挙関連のウェブサイトをアーカイブして公開しています。

Election 2006 - Harvested Web sites
http://www.collectionscanada.ca/collection/003-100-e.html

ページ