Internet Archive

ルクセンブルク国立図書館(BnL)、ルクセンブルクドメインのウェブサイト等を収集したウェブアーカイブ“webarchive.lu”を公開

2020年1月7日、ルクセンブルク国立図書館(BnL)はウェブサイト“webarchive.lu”の公開を発表しました。

“webarchive.lu”は、ルクセンブルクのウェブサイトアーカイブ事業の情報プラットフォーム、及びBnLがアーカイブしたウェブサイトを検索するためのアクセスポイントとなるウェブサイトです。ルクセンブルクでは、2009年11月に修正された法定納本制度により、BnLは印刷出版物だけでなく、ルクセンブルクで出版されたデジタル形式のあらゆる文書も収集しています。ルクセンブルクのドメイン(「.lu」)を持つ全てのウェブサイト、その他のルクセンブルク住民によって作成されたウェブサイトを対象に、定期的なドメインのクロールによる大規模収集などInternet Archive(IA)とも連携したウェブアーカイブが実施されています。“webarchive.lu”では、2017年の地方選挙、2018年の総選挙、2019年の欧州議会選挙などの特定のイベントに関する特別コレクションも提供されています。

著作権法の規定により、アーカイブされたウェブサイトへはBnLの館内からのみアクセスできます。“webarchive.lu”は現在英語で構築されていますが、まもなくフランス語でも利用可能になる予定です。

Internet Archive(IA)はどのようにLPレコードをデジタル化しているのか(記事紹介)

Internet Archive(IA)の2019年10月23日付けブログ記事で、IAが進めているLPのデジタル化作業が紹介されています。著者は米・ニューヨークを拠点とするフリーランスのライター・Faye Lessler氏です。

IAでは、米・ボストン公共図書館との協力により、同館が所蔵する10万を超える音源のデジタル化を2019年に開始しました。音源は、蝋管、SPレコード、LPレコードなど様々な媒体に記録されています。

LPレコードのデジタル化作業では、最初にカバーアート、ディスク本体、付属資料の高精細画像の撮影と、レコードラベル、記録年、トラックリスト等のメタデータが作成されます。メタデータは様々な外部データベースとの照合によるクロスチェックが行われます。

続いて、IAが提携しているInnodata Knowledge Services社によって、フィリピン・セブ島にある同社の施設で音源のデジタル化作業が実施されます。12のターンテーブルで一枚ずつ、等倍速での再生によりデジタル化しており、作業量としては1時間あたり10枚程度となっています。

Internet Archive(IA)、Wikipediaの記事内の13万件の図書への参照を、IAがデジタル化した図書へのリンクに置き換え

2019年10月29日、Internet Archive(IA)は、英語版・ギリシャ語版・アラビア語版を含むいくつかの言語版のWikipediaの記事内の13万件の図書への参照を、IAがデジタル化した図書5万件へのリンクに置き換えたと発表しています。

デジタル化された図書の当該ページにリンクされていますが、図書全体を読みたい場合は、“Controlled Digital Lending”を通じてデジタル化された資料を借りることができます。

この作業は開始したばかりで、Wikipediaのコミュニティと連携し、今後も継続して実施することが想定されています。

Weaving Books into the Web-Starting with Wikipedia(Internet Archive Blogs, 2019/10/29)
https://blog.archive.org/2019/10/29/weaving-books-into-the-web-starting-with-wikipedia/

Internet Archive(IA)と古書店のBetter World Booksが収集した未デジタル化資料のデジタル化に関し連携

2019年11月6日、Internet Archive(IA)と古書店のBetter World Booksが新たな連携を発表しました。

2003年に設立されたBetter World Booksは、6つの国の図書館・書店・大学から古本を収集し、販売・寄贈・リサイクルを行っていますが、今回の連携により、収集された古本が未デジタル化資料であった場合、IAによるデジタル化の対象となります。

研究図書館グループ(RLG)の前会長で、Better World Booksの役員であるミハルコ(Jim Michalko)氏は、今回の連携により、未デジタル化資料だった場合にデジタル化されると分かって図書館がBetter World Booksに除籍資料を提供できるようになることから、図書館は責任あるコレクション管理を果たすことができると発言しています。

Internet Archive(IA)、2,500本以上のMS-DOS用ゲームをソフトウェアライブラリ上で追加公開

Internet Archive(IA)の2019年10月13日付けのブログ記事において、IAのソフトウェアライブラリ上でのMS-DOS用ゲーム2,500本以上の追加公開が発表されています。

これらの追加公開は、DOS用ゲームを現代のシステム上で容易にプレイできるようにすることを目指すプロジェクト“eXoDOS”の成果であり、ゲームはウェブブラウザ上でプレイできるようになっています。CD-ROMをベースにしたゲームは、プレイ時に大容量のコンテンツ全てをメモリ上に読み込み保持する仕組みとなっており、ウェブブラウザを閉じると保持されたデータが失われること、読み込みにかなりの時間がかかることが紹介されています。

2,500 More MS-DOS Games Playable at the Archive(IA, 2019/10/13)
http://blog.archive.org/2019/10/13/2500-more-ms-dos-games-playable-at-the-archive/

Internet Archive(IA)、収録音楽の再生機能に新しい機能を追加:最新曲のフルバージョンへのリンク・ブックレット/レーベルのデジタル化画像の追加・関連する楽曲の表示

2019年10月17日、Internet Archive(IA)は、収録音源の再生機能に新しい機能を追加したと発表しています。

最新曲についてはこれまでサンプルのみ試聴できましたが、SpotifyやYouTubeで公開されているフルバージョンへのリンクを追加しています。

CDのブックレットやレーベルの高精細のデジタル化画像も追加され、また、各曲のページ下部にはカバー曲、同じアーティストによる他のバージョン、コンピレーション・アルバムでの収録曲といった関連する音楽のリストも表示されます。

Adding New Features to the Internet Archive Music Experience(Internet Archive Blogs,2019/10/17)
https://blog.archive.org/2019/10/17/adding-new-features-to-the-internet-archive-music-experience/

Center for Open Science(COS)、Internet Archive(IA)と共同で科学研究プロセスに関連するオープンデータのアーカイブプロジェクトを実施

2019年9月18日、非営利団体Center for Open Science(COS)は、Internet Archive(IA)と共同で科学研究プロセスに関連するオープンデータのアーカイブプロジェクトを実施することを発表しました。

米国の博物館・図書館サービス機構(IMLS)による2019年の“National Leadership Grants for Libraries Program”による助成を受けたプロジェクトであり、COSとIAは、科学研究プロセスに関するオープンデータが永続的なアクセス、再配布、再利用のために確実にアーカイブされるよう協力するとしています。

同プロジェクトでは、オープンな研究データ、図書館での長期的な管理業務、分散型データ共有・保存ネットワークという3つの分野に焦点を当てることにより、オープンサイエンスとデータキュレーションのさらなる支援のため、よりよいデータ共有基盤の試作・実装が行われます。

2019年9月24日にはIAも同プロジェクト実施に関するより詳しい発表を行っており、その中では以下の点も紹介されています。

Internet Archive(IA)、欧州の少数言語の機械翻訳進展のため、英・エジンバラ大学にウェブアーカイブの一部を提供

2019年6月19日、Internet Archive(IA)が、特にリソースが不足している言語の機械翻訳を進展させるためのオープンデータとツール構築のため、英国のエジンバラ大学にウェブアーカイブの一部を提供すると発表しています。

エジンバラ大学は、EUのインフラプロジェクトを支援する「コネクティング・ヨーロッパ・ファシリティ」からの助成を受け、他の大学と共同で、29の言語を対象として、ウェブから翻訳されたテキストをマイニングするプロジェクト“ParaCrawl”を行っています。

今回、IAが収集したウェブアーカイブを“ParaCrawl”プロジェクトに追加することで、マイニング対象となるアーカイブデータが増えることになります。IAでは、アイスランド語・クロアチア語・ノルウェー語・アイルランド語といった翻訳されたテキストが少ない言語を、内部的な分類ツールを用いてIAの通常のウェブアーカイブの中から抽出します。

カナダ・アルバータ大学、Internet Archive(IA)と連携し、大学創設以来の修士論文・博士論文を含む図書館の蔵書のデジタル化作業を実施中

カナダのアルバータ大学がInternet Archive(IA)と連携して、同大学の図書館の蔵書のデジタル化作業の一環として、1908年の大学創設以来の1万4,000点の修士論文・博士論文をデジタル化して公開する作業を行っていることを紹介しています。

これまで、2,200点の博士論文を含む10万2,759点の資料がデジタル化されました。

U of A digitization project aims to make valuable research accessible to all(Folio University of Alberta,2019/3/25)
https://www.folio.ca/u-of-a-digitization-project-aims-to-make-valuable-research-accessible-to-all/

Internet Archive(IA)、米・ボストン公共図書館(BPL)から移管されたSPレコードの音源をデジタル化して公開

2019年3月29日、Internet Archive(IA)が、米・ボストン公共図書館(BPL)からデジタル化及び物理媒体の保存のために移管されたSPレコード(78rpm)5万点を超す音源をデジタル化して公開したと発表しました。

作業期間は18か月で、Internet ArchiveによるSPレコードのデジタル化プロジェクト“Great 78 Project”の中での最大のコレクションとなりました。

デジタル化とあわせて、ボランティアにより、手動及びアルゴリズムを用いて、出版されたディスコグラフィー(目録)との紐付け作業が実施されており、80%以上の音源が、その当時のレビュー情報を保持しているかもしくはリンクがなされています。また、250作品については、米・コネチカットカレッジの楽譜のデジタルコレクションを基に、その曲の楽譜が併せて表示されます。

ページ