ウェブアーカイブ

Internet Archive(IA)、公共図書館を対象とした地域の歴史のウェブアーカイブ構築支援プログラム“Community Webs”に新たに約50館が参加すると発表:参加館が90館を超す

2021年4月26日、Internet Archive(IA)は、地域の歴史のウェブアーカイブ構築を支援するための公共図書館を対象としたプログラム“Community Webs”に、新たに50館以上の公共図書館が参加すると発表しました。

これにより、同事業の参加館は、33州と3の準州からの90館を超す規模となりました。参加館には、州立図書館・大都市の図書館・地方の小規模館や米領サモアの図書館といった多様な館が含まれています。

同事業では、特に伝統的に社会的弱者の集団の資料をアーカイブすることに力を入れており、参加館は、現在、コレクション開発といった内容の研修を受けており、地域の多様性やイベント・文化を反映したデジタルコレクションの開発を始めているとしています。

E2372 - 2020年度NDLデジタルライブラリーカフェ<報告>

ディスカッションでは,データの利用拡大には,流行や時事によらず多様に使える汎用的なオープンデータセットの提供や,巨大で多様なデータの統合的な分析に使えるように,メタデータへの日本十進分類法(NDC)による分類付与やData Catalog Vocabulary(DCAT)等の標準的な語彙とWARPからの出力項目との対応表の作成・公開が有効等の意見があった。

米・コロンビア大学図書館、米国における民主主義改革と投票権に関するウェブアーカイブを公開

2021年4月8日、米・コロンビア大学図書館が、米国における民主主義改革と投票権に関するウェブアーカイブ“Democracy Reform and Voting Rights in the United States”を公開したことを発表しました。

目的として、2020年に新型コロナウイルス感染症感染拡大下で行われた米国大統領選挙を契機とした議論、その後の立法活動等を記録することが述べられています。

サブトピックとして、資金改革運動、作為的に選挙区を定める「ゲリマンダリング」、有権者登録等を挙げており、4月12日時点では、30件のウェブサイトのアーカイブ結果が公開されています。

秩父宮記念スポーツ博物館・図書館、「秩父宮記念スポーツ博物館・図書館資料収集方針」を策定

2021年4月2日、秩父宮記念スポーツ博物館・図書館が、「秩父宮記念スポーツ博物館・図書館資料収集方針」(3月30日付)を策定したと発表しています。

2019年10月に設置された「資料の価値づけ及び収集方針策定等検討ワーキンググループ」が2020年12月23日に提出した最終報告書を踏まえ館内で検討し策定されたものです。

指針では、同館において収集する「スポーツ資料」は、日本のスポーツに関し、①日本におけるスポーツ及び競技の発展、また、②日本におけるスポーツと社会とのつながりやスポーツ文化の拡がりを示す、日本のスポーツ研究(スポーツ史及びスポーツ科学、体育・スポーツ教育など)及び競技の理解のために欠くことができないものであり、これまでのコレクションの継続を図るとともに、特に散逸等のおそれが高く、国において保全する必要のあるものを対象とするとしており、以下の4つのテーマを掲げています。

(1)スポーツイベント: 日本のスポーツ史上の画期となる顕著な大会・事象
(2)競技: 伝統的な身体文化と近代スポーツ受容後の競技の発展を示すもの
(3)人物: 日本のスポーツ史上注目される顕著な個人
(4)デジタル情報: 上記(1)~(3)を包含する要素

国立国会図書館東日本大震災アーカイブ(ひなぎく)、閉鎖した「農林漁業協同組合の復興への取組み記録 東日本大震災アーカイブズ」のデータを承継して公開

2021年3月4日、国立国会図書館東日本大震災アーカイブ(ひなぎく)は、株式会社農林中金総合研究所(農中総研)が閉鎖した「農林漁業協同組合の復興への取組み記録 東日本大震災アーカイブズ」のデータを承継し、ひなぎく上で公開したことを発表しました。

「農林漁業協同組合の復興への取組み記録 東日本大震災アーカイブズ」は、農中総研が農林漁業協同組合(農協・漁協・森林組合など)や全中・全漁連・全森連などと連携し、震災からの復旧・復興に各地域がどのように取り組んでいるかの情報をデータベース化したウェブサイトとして2012年3月に公開されました。東日本大震災の発災から10年を迎え、取組みを⾵化させないために、農中総研は関係団体と協議のうえ、提供された掲載情報を国⽴国会図書館へ寄贈することとし、2020年11月30日をもって同アーカイブを閉鎖しました。

国⽴国会図書館が承継したデータは、承継前と同様にひなぎく上で検索することが可能です。なお、ひなぎく上で閲覧できる承継データは、国立国会図書館インターネット資料収集保存事業(WARP)で保存したものとなります。

米国議会図書館(LC)による、新型コロナウイルス感染症に関するコレクションの構築(記事紹介)

2021年3月2日、米国議会図書館(LC)が、同館の新型コロナウイルス感染症(COVID-19)感染拡大を記録するコレクションに関する記事を公開しました。

LCは、ロックダウンやソーシャルディスタンシングの開始時からCOVID-19関連の資料収集を行っており、収集された資料の中には、個人やコミュニティにおけるCOVID-19の影響を記録した写真や芸術家の反応等が含まれています。

記事では、以下のコレクションについて紹介が行われています。一部は、オンラインで閲覧可能です。

・現代芸術家が作成したコロナ禍関連ポスター
・Flickrと協力し投稿を募った、COVID-19感染拡大下の米国人の経験に関する写真コレクション
・写真家Camilo Vergara氏から寄贈を受けた、COVID-19に関連する写真
・LCの音楽部(Music Division)が構築を計画している、舞台芸術のCOVID-19対応に関するコレクション
・芸術家Toni Lane氏が作成した絵画
・COVID-19に関する分析や経緯の理解に資するデータ
・COVID-19感染拡大に関するウェブサイトの収集
・文書資料

米・アイビー・プラス図書館連合、ウェブアーカイブ“Global Social Responses to COVID-19 Web Archive”を公開

2021年3月1日、米・アイビー・プラス図書館連合が、ウェブアーカイブ“Global Social Responses to COVID-19 Web Archive”を公開したと発表しています。

コロナ禍の人道・社会経済・文化への影響の範囲を理解するために重要な、コロナ禍への地域的・社会的反応を記録化したもので、アイビー・プラス図書館連合が、独・バイエルン州立図書館、米国議会図書館(LC)、米・ニューヨーク公共図書館(NYPL)、独・ベルリン国立図書館、米・カリフォルニア大学バークレー校、米・ハワイ大学、米・ミシガン大学、カナダ・トロント大学、米・バージニア大学の図書館員と連携し2020年3月に立ち上げたイニシアチブの成果です。

公開時点で、約80か国からの50言語以上の2,000を超すウェブサイトが収集されています。収集対象は、少数派の民族や無国籍グループが作成したウェブサイトに重点が置かれており、以下のものに限定はされないが、公衆衛生・人道支援・教育を行う非政府組織のウェブサイト、あらゆる分野の文化を創造する有名・無名の芸術家によって公開されたウェブサイト、地域のニュースを公開するウェブサイト、市民団体への参加者や代表者のウェブサイト、関連するブログやソーシャルメディア等が含まれると説明されています。

国立国会図書館インターネット資料収集保存事業(WARP)、2021年3月の特集「東日本大震災10周年」を公開

2021年3月1日、国立国会図書館(NDL)は、インターネット資料収集保存事業(WARP)の2021年3月の特集として「東日本大震災10周年」を公開しました。この10年間にWARPが保存してきた東日本大震災に関するウェブサイトを紹介するものです。

震災発生3日後の2011年3月14日から緊急に収集した国の機関や被災自治体などの関連ウェブサイト、原発事故を受けて設置された原子力規制委員会や東京電力福島原子力発電所事故調査委員会(国会事故調)などの原発事故関連ウェブサイト、被災者支援・復興への取組みに関するウェブサイトなどを紹介しています。

新着情報一覧(WARP)
https://warp.da.ndl.go.jp/contents/news/index.html
※2021年3月1日欄に「2021年3月の特集「東日本大震災10周年」を掲載しました」とあります。

Webrecorderプロジェクト、ウェブアーカイブに関する新たなファイルフォーマット“WACZ”のバージョン1.0をリリース

ウェブアーカイブのツール構築に取り組むWebrecorderプロジェクトは、2021年1月18日付けのブログ投稿において、ウェブアーカイブに関する新たなファイルフォーマット“WACZ”(Web Archive Collection Zipped)のバージョン1.0のリリースを発表しています。

WACZは、WARC形式の複数のファイルを、インデックスデータとともにZIP形式で圧縮するパッケージ・フォーマットとして機能します。仕様はGitHub上で公開されており、ファイル拡張子は「.wacz」です。

Webrecorderプロジェクトは、2020年8月12日付けのブログ投稿において、当時開発中であったWACZの解説を行っており、以下の利点等が紹介されています。

・個々のWARCファイルには自身のインデックスデータが含まれていないため、内容を特定するためにファイル全体を読み込む必要がある。一方、WACZではコンテンツのインデックスデータを含むため、インデックスを活用した部分的な読み込みが可能となる。
・WARCはタイトルや説明記述(description)のようなメタデータを保存できる設計となっていないが、WACZではそれらメタデータもまとめてパッケージ化することが可能である。

米国国立公文書館(NARA)、ドナルド・J・トランプ大統領図書館のウェブサイトを公開

2021年1月20日、米国国立公文書館(NARA)が、ドナルド・J・トランプ大統領図書館のウェブサイトの公開を発表しました。アーカイブされたホワイトハウスのウェブサイトやソーシャルメディアのアカウントの情報、および、トランプ政権の記録へのアクセスに関する情報を提供するものです。

NARAは、大統領記録法にもとづき、トランプ政権の全ての記録を受け取り、ワシントン,D.Cに所在する本館で保存します。保存された記録の提供は、大統領図書館法にもとづく15番目の大統領図書館であるドナルド・J・トランプ大統領図書館を通じて行われます。

NARAでは、前大統領が、大統領図書館法にもとづいてアーカイブ研究施設や博物館を建設し寄贈すると決定したかどうかに関わらず、政権によって作成された大統領記録のコレクションを「大統領図書館」として維持するとしています。また、トランプ前大統領の大統領センターや博物館の計画についての情報は、トランプ前大統領の事務所に尋ねるよう求めています。

ページ