ウェブアーカイブ

中国国家図書館、新浪公司と協力して微博(Weibo)の投稿を収集・保存することを発表:インターネット情報保存のための新プロジェクトの一環

2019年4月22日付けの新華網の記事で、中国国家図書館(NLC)によるインターネット情報戦略保存プロジェクトの開始が紹介されています。同プロジェクトでは、NLCと中国国内の機関・企業との協力により、インターネット情報の収集・保存が行われます。

記事によれば、NLCはポータルサイト「新浪網」やマイクロブログ「微博」(Weibo)を運営する新浪公司と協力して最初の「インターネット情報戦略保存基地」を設立し、新浪網が配信するニュースや微博上で公開される投稿について保存を行う予定とあります。

国家图书馆互联网信息战略保存项目启动 首家基地落户新浪(新華網, 2019/4/22)
http://www.xinhuanet.com/politics/2019-04/22/c_1124399654.htm

米国議会図書館(LC)、オンラインニュースサイトのウェブアーカイブを公開

2019年4月9日、米国議会図書館(LC)が、オンラインのみのニュースサイトのウェブアーカイブ“General News on the Internet Web Archive”を公開しました。

LCでは2014年6月から同サイトの収集を開始しており、毎週の収集と、RSSによる1日2回の収集を組み合わせて実施しています。2014年以前にLCが実施したウェブアーカイブで収集されたニュースサイトも含まれています。

アーカイブされたデータは1年間のエンバーゴとなっています。

Breaking: A New “News” Archive!(LC,2019/4/9)
https://blogs.loc.gov/headlinesandheroes/2019/04/news-archive/

韓国国立中央図書館(NLK)、韓国漫画映像振興院と業務協約を締結:ドラマ化・映画化されたウェブトゥーン(ウェブ漫画)の長期的・持続的な収集・保存

2019年4月2日、韓国国立中央図書館(NLK)が、韓国漫画映像振興院と業務協約を締結したと発表しました。

協約を通じて、両機関は、図書館法第20条2(オンライン資料の収集)に依拠して、ドラマ化・映画化されたウェブトゥーン(ウェブ漫画)の長期的・持続的な収集・保存に取組みます。

NLKでは、韓国漫画映像振興院から保存価値の高いウェブトゥーンの原文ファイルと書誌データの移管を受けて永久保存するとともに、ウェブトゥーン研究者のために研究情報サービスを提供する予定です。

국립중앙도서관-한국만화영상진흥원 간 업무협약(MOU) 체결(NLK,2019/4/2)
http://www.nl.go.kr/nl/commu/libnews/article_view.jsp?board_no=10027&notice_type_code=3&cate_no=4

国立国会図書館インターネット資料収集保存事業(WARP)、2019年4月の特集「WARPが集めた「平成」」を公開

2019年4月1日、国立国会図書館(NDL)は、インターネット資料収集保存事業(WARP)の2019年4月の特集として「WARPが集めた「平成」」を公開しました。

WARPで収集した平成の出来事や「平成」と名のつくもののウェブサイト、及びWARPでこれまでに作成した平成の出来事にちなんだコレクションを取り上げています。

国立国会図書館インターネット資料収集保存事業
http://warp.da.ndl.go.jp/
※「新着情報」欄に、「2019年4月1日 2019年4月の特集「WARPが集めた「平成」」を掲載しました。」とあります。

今月の特集(2019年4月) - WARPが集めた「平成」 -(WARP)
http://warp.da.ndl.go.jp/contents/special/special201904.html

オーストラリア国立図書館(NLA)、情報探索システム“Trove”上での“Australian Web Archive”の公開を発表

2019年3月4日、オーストラリア国立図書館(NLA)が、“Australian Web Archive”の公開を発表しています。

NLAの情報探索システム“Trove”上で公開されたもので、NLAが国内の文化機関と連携して収集したウェブアーカイブ“PANDORA”、NLAによるオーストラリア連邦政府機関のウェブアーカイブ“Australian Government Web Archive”(AGWA)、auドメインの年次のバルク収集の成果といった、1996年以降のウェブサイトのアーカイブが含まれています。

“PANDORA”の公式Twitterでは、今回の“Australian Web Archive”の公開により“Trove”上でインデキシングされたウェブアーカイブのコンテンツは、2月時点の約1億9,400万件から50億件超へと約27倍増加したと紹介されています。

@nlagovau(Twitter,2019/3/4)
https://twitter.com/nlagovau/status/1102799803312791552

アイルランド国立図書館(NLI)、2018年に収集したウェブアーカイブコレクション(国民投票・大統領選挙・英国のEUからの離脱)の公開を発表

2019年2月18日、アイルランド国立図書館(NLI)が、2018年に収集したウェブアーカイブのコレクションを公開していることを発表しています。

Internet Archive(IA)のウェブアーカイブコレクション構築サービス“Archive-It”を用いて公開されており、2018年に同国で行われた、中絶を禁止する憲法条項の改正をめぐる国民投票・大統領選挙や、英国のEUからの離脱(Brexit)に関するウェブサイトが収集・公開されています。

@NationalLibraryofIreland(Facebook,2019/2/18)
https://www.facebook.com/240989225037/posts/10161532440760038/

National Library of Ireland(ARCHIVE-IT)
https://archive-it.org/home/nli

オランダ王立図書館(KB)、同国の中国人コミュニティーをテーマとしたウェブアーカイブを館内で公開

2019年2月5日、オランダ王立図書館(KB)が、旧暦の正月にあわせて、同国の中国人コミュニティーに関するウェブアーカイブ“Chinese Netherlands' web collection”を同館閲覧室内の端末で公開したと発表しています。閲覧には有効期限内の図書館カードが必要です。研究者は同コレクションの「データセット」や「リンク分析」を利用することもできます。

同国では中国人が100年以上にわたって活動してきたにもかかわらず、彼らや彼らのオンライン上での文化について詳しくないことから取り組まれたもので、公開されたコレクションは、KBのウェブアーカイブチームに中国人インターンが加わって構築され、446のウェブサイトが含まれます。

コレクションは「ショップ」「レストランと食」「ブログ」「文化・芸術・歴史」「教育」「語学学校」「中国人の専門家」「地域グループ」「情報プラットフォーム」「中・蘭交流グループ」「祭礼・儀式」「移民グループ」「ニュース・メディア」「政治・社会問題」「留学生」「中国医学」「(中国)駐在員事務所」の17のカテゴリーに分類していると紹介されています。

E2101 - 2018年IIPC総会・ウェブアーカイブ会議<報告>

国際インターネット保存コンソーシアム(IIPC;CA1893参照)の総会及びウェブアーカイブ会議(WAC;E1819ほか参照)が2018年11月12日から11月15日まで,ニュージーランドの首都ウェリントンにあるニュージーランド国立図書館(NLNZ)で開催された。国立国会図書館(NDL)からは筆者が参加した。NDLからの両会議への参加は2年ぶりである。

ウェブアーカイブ用ツールWeb Curator Tool(WCT)のVer.2.0が公開

2018年12月21日、オランダ王立図書館(KB)は、選択的ウェブアーカイブのためのツールWeb Curator Tool(WCT)のVer.2.0がGithubで公開されたことを発表しています。

2017年の後半からニュージーランド国立図書館(NLNZ)とKBが共同で開発してきたもので、11月14日に開催された国際インターネット保存コンソーシアム(IIPC)のウェブアーカイブ会議ではプレビューが行われました。

WCTのインストールとサポートの改善、ドキュメントのreadthedocsプラットフォームへの移行、最新のウェブをアーカイブするためのニーズへの対応、が今回の更新の目的です。

WCTは、IIPCの主導により、2006年にNLNZと英国図書館(BL)により共同開発されましたが、2018年1月からはNLNZとKBにより更新のための作業が行われています。

英国図書館(BL)、ウェブアーカイブ“UK Web Archive”の新しいインターフェイスを公開

2018年12月20日、英国図書館(BL)が、ウェブアーカイブ“UK Web Archive”の新しいインターフェイスの公開を発表しました。

“Open UK Web Archive”(2005年に収集を開始。約1万5,000件のウェブサイトが閲覧可能)と“Legal Deposit Web Archive”(英国の納本図書館(BL・スコットランド国立図書館・ウェールズ国立図書館・オックスフォード大学ボドリアン図書館・ケンブリッジ大学図書館・トリニティカレッジダブリン)内でのみ閲覧可能)搭載コンテンツの一括検索への対応、特定のテーマやイベントに関するウェブサイトを集めた“Collections”ページの公開等が行なわれています。

2019年には、納本制度により収集したコレクションを追加する予定とのことです。

ページ