ウェブアーカイブ

国立国会図書館インターネット資料収集保存事業(WARP)、2021年3月の特集「東日本大震災10周年」を公開

2021年3月1日、国立国会図書館(NDL)は、インターネット資料収集保存事業(WARP)の2021年3月の特集として「東日本大震災10周年」を公開しました。この10年間にWARPが保存してきた東日本大震災に関するウェブサイトを紹介するものです。

震災発生3日後の2011年3月14日から緊急に収集した国の機関や被災自治体などの関連ウェブサイト、原発事故を受けて設置された原子力規制委員会や東京電力福島原子力発電所事故調査委員会(国会事故調)などの原発事故関連ウェブサイト、被災者支援・復興への取組みに関するウェブサイトなどを紹介しています。

新着情報一覧(WARP)
https://warp.da.ndl.go.jp/contents/news/index.html
※2021年3月1日欄に「2021年3月の特集「東日本大震災10周年」を掲載しました」とあります。

Webrecorderプロジェクト、ウェブアーカイブに関する新たなファイルフォーマット“WACZ”のバージョン1.0をリリース

ウェブアーカイブのツール構築に取り組むWebrecorderプロジェクトは、2021年1月18日付けのブログ投稿において、ウェブアーカイブに関する新たなファイルフォーマット“WACZ”(Web Archive Collection Zipped)のバージョン1.0のリリースを発表しています。

WACZは、WARC形式の複数のファイルを、インデックスデータとともにZIP形式で圧縮するパッケージ・フォーマットとして機能します。仕様はGitHub上で公開されており、ファイル拡張子は「.wacz」です。

Webrecorderプロジェクトは、2020年8月12日付けのブログ投稿において、当時開発中であったWACZの解説を行っており、以下の利点等が紹介されています。

・個々のWARCファイルには自身のインデックスデータが含まれていないため、内容を特定するためにファイル全体を読み込む必要がある。一方、WACZではコンテンツのインデックスデータを含むため、インデックスを活用した部分的な読み込みが可能となる。
・WARCはタイトルや説明記述(description)のようなメタデータを保存できる設計となっていないが、WACZではそれらメタデータもまとめてパッケージ化することが可能である。

米国国立公文書館(NARA)、ドナルド・J・トランプ大統領図書館のウェブサイトを公開

2021年1月20日、米国国立公文書館(NARA)が、ドナルド・J・トランプ大統領図書館のウェブサイトの公開を発表しました。アーカイブされたホワイトハウスのウェブサイトやソーシャルメディアのアカウントの情報、および、トランプ政権の記録へのアクセスに関する情報を提供するものです。

NARAは、大統領記録法にもとづき、トランプ政権の全ての記録を受け取り、ワシントン,D.Cに所在する本館で保存します。保存された記録の提供は、大統領図書館法にもとづく15番目の大統領図書館であるドナルド・J・トランプ大統領図書館を通じて行われます。

NARAでは、前大統領が、大統領図書館法にもとづいてアーカイブ研究施設や博物館を建設し寄贈すると決定したかどうかに関わらず、政権によって作成された大統領記録のコレクションを「大統領図書館」として維持するとしています。また、トランプ前大統領の大統領センターや博物館の計画についての情報は、トランプ前大統領の事務所に尋ねるよう求めています。

米国国立公文書館(NARA)、トランプ政権の公式ソーシャルメディアのすべてのコンテンツを収集・保存・提供すると発表

米国国立公文書館(NARA)が、@realdonaldtrumpや@POTUSから削除された投稿を含む、トランプ政権の公式ソーシャルメディアのすべてのコンテンツを収集・保存・提供すると発表しています。

ホワイトハウスでは、大統領記録法に従い、NARAと相談のうえ、全てのコンテンツを収集・保存するアーカイビングツールを使用しており、これらの記録は2021年1月20日にNARAに引き渡され、NARAが新たに公開するウェブサイト“trumplibrary.gov”で公開されます。

@USNatArchives(Twitter,2021/1/11)
https://twitter.com/USNatArchives/status/1348330024420700160

米国議会図書館(LC)の新型コロナウイルス感染症感染拡大下におけるウェブアーカイビング(記事紹介)

2020年12月30日付で、米国議会図書館(LC)が、新型コロナウイルス感染症感染拡大下における同館のウェブアーカイビング事業に関するブログ記事を公開しました。

同館では、2020年3月中旬から、新型コロナウイルス感染症感染拡大防止のための休館や職員のテレワークといった対応を行っていました。その時点から、感染拡大に関するウェブコンテンツの収集を行っていたということが述べられています。

ウェブアーカイビングを実施する中で明らかになったこととして、収集するウェブサイト数を急速に増やした一方、十分な収集計画がなかったこと、次年度予算に関する不確実性の高まり等が挙げられています。

また、記事中では、6月中旬に承認された、ウェブアーカイビング事業の範囲と資金を考慮した収集計画についても言及されています。計画策定は、新型コロナウイルス感染症感染拡大に関する同館のウェブアーカイブコレクションに関するギャップを解消すること、米国内で優先度が高いトピックを決定すること、既に収集しているコンテンツの識別と組織化の改善を目的に行われました。

Internet Archive、Andrew W. Mellon財団からの助成をうけ、地域の歴史のウェブアーカイブ構築のための公共図書館を対象としたプログラム“Community Webs”の規模拡大を発表

2020年12月8日、Internet Archive(IA)は、地域の歴史のウェブアーカイブ構築のための公共図書館を対象としたプログラム“Community Webs”が、Andrew W. Mellon財団から113万ドルの助成を受けたと発表しています。

同プログラムは2017年の創設以来、21州の40の公共図書館で実施され、文書・画像・動画といった媒体からなる地域の市民の生活を記録した300ものコレクション(50TB以上)をウェブアーカイブしてきました。

今回の助成を受け、全米50州の各州最低2館づつに加え、米国領土内の地域の歴史団体もあわせて150から200の参加が可能となるとしています。参加館は、ウェブアーカイブや閲覧のためのサービスのほか、研修、コミュニティウェブアーカイブ促進のための資金の提供をうけることができます。

また、公共図書館によるコミュニティウェブアーカイブの成果を、専門的なツールやデータセットを通じて研究者が使用できるよう、米国デジタル公共図書館(DPLA)といったプラットフォームと提携を行なうとともに、地域の歴史のデジタル保存の努力を進展させるため、州や地域の団体と連携するとしています。

12月の上旬には参加館を募集する予定としています。

米・アイビー・プラス図書館連合、南アジア地域のジェンダー・セクシュアリティに関連する運動等の記録を収集したウェブアーカイブを公開

2020年11月25日、米国のアイビー・プラス図書館連合は、ウェブアーカイブ“South Asian Gender and Sexuality Web Archive”が公開されたことを発表しました。

同アーカイブは、家父長制に対抗する人々を支援するために、南アジア及び南アジアから世界各地に離散した性的マイノリティ(LGBTQAI+)や女性運動の記録を保存する目的で構築されました。NGOや活動家団体、個人がウェブ上で作成したコンテンツに特に重点を置いて、南アジア地域のジェンダー・セクシュアリティ問題に関連するアドボカシーや教育、社会基盤強化の取り組みに、これらの組織がどのようなアプローチを試みているかを示したものである、と説明しています。また、当事者である女性やLGBTQAI+の人々の直接の意見が反映された口述記録・文章・パフォーマンス等の収集も重視したことで、疎外された人々の苦闘や逆境に対抗するあり方についての洞察を得ることが可能な貴重資料を提供している、としています。

米国議会図書館(LC)の法律図書館が今夏に公開した“Indigenous Law Web Archive”:先住民の部族政府策定の法律情報等を収集

2020年11月18日、米国議会図書館(LC)の法律図書館が、同館のブログにおいて、今年の夏に公開した“Indigenous Law Web Archive”を紹介しています。

先住民の部族政府においても法律の公布が紙媒体からデジタル媒体に移行しつつあることから、オンラインで公開された米国の578の連邦承認部族の政府や裁判所の法令・書式、および、カナダのいくつかの先住民の法律情報を収集し構築されたウェブアーカイブです。1年間のエンバーゴを経て公開されました。

先住民の法律に関する実務家や研究者を支援すること等が意図されています。

View Our New Web Resource: Indigenous Law Web Archive(In Custodia Legis Law Library of Congress, 2020/11/18)
https://blogs.loc.gov/law/2020/11/view-our-new-web-resource-indigenous-law-web-archive/

【イベント】2020年「NDLデジタルライブラリーカフェ」(第1回12/10、第2回1/15・オンライン)

2020年12月10日と2021年1月15日に、国立国会図書館(NDL)が、2020年「NDLデジタルライブラリーカフェ」をオンラインで開催します。

デジタルライブラリーに関わる研究や最新動向をより身近に、より楽しくする講演会であり、科学者と市民が気軽に科学の話題について語り合う「サイエンスカフェ」の手法を取り入れ、ゲストが紹介する最新の話題について、参加者を交えて語り合います。

参加費は無料で、定員は各回30人(要事前申込)です。

<第1回「ウェブアーカイブの活用と課題:WARPと国内外の事例から」>
・日時:2020年12月10日 14時00分から15時40分
・講師(登壇予定順):
高峯康世(国立国会図書館関西館電子図書館課ネットワーク情報第一係長)
志村努(同課情報システム係主査)
上島邦彦氏(株式会社日本データ取引所事業企画部/一般社団法人データ流通推進協議会技術基準検討委員会副主査・書記/研究データ利活用協議会データライセンス小委員会委員)
浅原正幸氏(国立国語研究所コーパス開発センター教授)

WARCnet、新型コロナウイルス感染症に関するウェブアーカイブの概要を調査した一連のレポートを公開中:欧州の複数機関を対象として担当者にインタビューを実施

2020年11月3日、WARCnet(Web ARChive studies network)は、レポートシリーズ“Exploring special web archives collections related to COVID-19”として、新たに3つのレポートを公開したことを発表しました。

同シリーズでは、新型コロナウイルス感染症に関する欧州各国のウェブアーカイブの概要を、担当者へのインタビューにより調査しています。これまでに、フランス国立視聴覚研究所(INA)、ルクセンブルク国立図書館(BnL)、デンマークのウェブアーカイブ“Netarkivet”、ハンガリーの国立セーチェーニ図書館を対象としたレポートが公開されており、新規公開分では英国のウェブアーカイブ“UK Web Archive”、スイス国立図書館、国際インターネット保存コンソーシアム(IIPC)を対象としています。

なお、WARCnetは、ウェブアーカイブ研究者等を対象としたネットワーク活動であり、研究者らに国際的・学際的な活動の場を提供しています。デンマーク・オーフス大学のコミュニケーション・文化学部(School of Communication and Culture)による主導の下、活動は2020年から2022年にかけて実施されます。

ページ