ウェブアーカイブ

LCのテーマ別ウェブアーカイブ

米国議会図書館(LC)は2000年から、テーマ別、イベント別のウェブアーカイブプロジェクトに取り組んでいます。現在取り組んでいるテーマの一つが、連邦最高裁判所判事の任命手続きで、テーマに関連する団体のウェブサイトだけでなく、関連するブログやTwitter上のつぶやき(Tweet)なども含めてアーカイブするということです。

Web Capture Projects
http://www.loc.gov/webcapture/projects.html

英国国立公文書館、ウェブアーカイブについての調査を実施

英国国立公文書館(NA)は、アーカイブされたウェブサイトがどのように収集され、利用者に公開されているかについての調査を実施すると発表しました。調査は英国情報システム合同委員会(JISC)の資金提供により行われ、UK Web Archiving Consortiumとの協力で実施されるとのことです。目的は、次のようなものとされています。
・英国のウェブアーカイブが現在どのように利用者に提供されているのか、及び将来はどうなるのか、を調査する
・英国のオンラインコンテンツの歴史的・研究的価値を定義する
・ウェブアーカイブを実施している様々な組織を概観する

調査は2009年6月下旬まで行われ、結果はNA等のウェブサイトで2009年8月に公開される予定とのことです。

New study - Web archives: now and in the future(2009年5月21日付け英国国立公文書館ウェブサイトのニュース)
http://www.nationalarchives.gov.uk/news/stories/308.htm

文部科学省、「Web社会分析基盤ソフトウェアの研究開発」を公募

文部科学省が2009年5月7日から、ウェブ上の情報を効率よく収集、蓄積し、高度な分析を行う下記の技術の実現を目指す、次世代IT基盤構築のための研究開発「Web社会分析基盤ソフトウェアの研究開発」に関する研究開発提案の公募を開始しています。

次世代IT基盤構築のための研究開発「Web社会分析基盤ソフトウェアの研究開発」に関する研究開発提案の公募について:文部科学省
http://www.mext.go.jp/b_menu/boshu/detail/1261118.htm

Wayback Machine、新データセンター上でのサービスを始動

Internet Archiveは2009年3月29日、Sun Microsystems社の協力の下、Wayback Machineの全てのウェブアーカイブデータ(約4.5ペタバイト)を保存する新しいデータセンターを始動することを発表していましたが、4月24日、新データセンター上でのサービスを開始しました。これにより、1秒間に500リクエストを処理できるようになったということです。なおこのデータセンターは、屋外に置くことができるコンテナー式のモジュラー型データセンターで、これによりデータの維持管理費と場所の効率化を図ることができます。

Wayback Machine comes to life in new home
(Internet Archiveの4月24日のニュースリリース)
http://www.archive.org/iathreads/post-view.php?id=243665

New Archive Datacenter with Sun
(Internet Archiveの3月29日のニュースリリース)
http://www.archive.org/iathreads/post-view.php?id=238517

Sun Microsystems社による資料
(モジュラー型データセンターの有効性を説明する動画資料もあり)

LC法律図書館、法律に関するブログのウェブアーカイブを公開

米国議会図書館(LC)の法律図書館は、2007年から各種の法律に関するブログ、通称“blawg”のウェブアーカイビングを行っています。このほど、100サイト以上に上るそのアーカイビングコレクションを公開しました。おおよそ月1回の頻度で収集しているようです。

Web Archive Collections - Law Library of Congress (Library of Congress)
http://www.loc.gov/law/find/web-archive/legal-blawgs.php

DCC、新マニュアル「ウェブ資源のアーカイビング」と新ブリーフィングペーパー「データベースのアーカイビング」を刊行

英国のデジタルキュレーションセンター(DCC)が、新しいデジタルキュレーションマニュアル「ウェブ資源のアーカイビング」および新しいブリーフィングペーパー「データベースのアーカイビング」を刊行しています。

Curation Manual: Archiving Web Resources
http://www.dcc.ac.uk/resource/curation-manual/chapters/archiving-web-resources/

Digital Curation Centre: Resource Centre: Briefing Papers: Database Archiving
http://www.dcc.ac.uk/resource/briefing-papers/database-archiving/

米国労働省、Internet Archiveと提携してウェブサイトを保存へ

米国労働省(U.S. Department of Labor)はInternet Archiveと提携し、同省のウェブサイト上にあるすべてのドキュメントの、ある時点での完全なスナップショットを保存し、提供するプロジェクトに、2009年1月上旬から取り組んでいます。現在、このようにして保存されたコンテンツを見るための、専用のウェブサイトが設けられています。

U.S. Department of Labor announces digital ‘snapshot’ project to archive content of all departmental Web sites
http://www.dol.gov/opa/media/press/oasam/oasam20091865.htm

Department of Labor Web Archive

国際インターネット保存コンソーシアム、メンバーのプロフィール調査の結果概要を公表

国際インターネット保存コンソーシアム(IIPC)が、そのメンバーに対し実施したプロフィール調査の結果概要を公表しています。IIPCのメンバー構成、インターネットアーカイブの対象、それぞれのメンバーの事業における、アーカイブするコンテンツを選ぶ際のガイドラインの有無、業務に携わっているスタッフといった事業に関する質問のほか、使用しているクローラー、メタデータ形式など技術面に関する質問もなされています。

International Internet Preservation Consortium Announces 2008 Member Profile Survey Results(IIPCのプレスリリース)
http://netpreserve.org/press/pr20081219.php

調査結果本文
http://netpreserve.org/publications/reports.php?id=005

ドイツ国立図書館、ウェブ上の出版物の納本に関するFAQを発表

ドイツのメルケル(Angela Merkel)首相が2008年10月17日、ネット上の出版物に対応するべく改訂した納本令を公布しました。これを受けてドイツ国立図書館(DNB)が、ネット上の出版物の納本に関する細部を規定したFAQを発表しています。

フランス国立図書館、ウェブアーカイブを館内限定で公開

フランス国立図書館(BnF)が、館内(フランソワ・ミッテラン館内調査研究用図書館レ・ド・ジャルダン)限定でウェブアーカイブを公開したと発表しています。これは2006年の法制化に基づき、.frドメイン、および、.frドメイン以外でフランス人あるいはフランス国内で作成されたウェブサイトを優先し、選択的にロボットで収集したもので、2004年から毎年Internet Archiveと協同で大規模に収集しているコレクションと、2007年の大統領選挙・議会選挙など特定のトピックについて、担当のライブラリアンがチェックした特定のサイトをより高頻度でより完全に収集したコレクションの2つからなる、とされています。

なお2008年4月時点で、BnFが収集したファイルは130億点に達しているとのことです。

BnF-Collections : Archives de l'Internet

ページ