Internet Archive

Internet Archive(IA)、欧州の少数言語の機械翻訳進展のため、英・エジンバラ大学にウェブアーカイブの一部を提供

2019年6月19日、Internet Archive(IA)が、特にリソースが不足している言語の機械翻訳を進展させるためのオープンデータとツール構築のため、英国のエジンバラ大学にウェブアーカイブの一部を提供すると発表しています。

エジンバラ大学は、EUのインフラプロジェクトを支援する「コネクティング・ヨーロッパ・ファシリティ」からの助成を受け、他の大学と共同で、29の言語を対象として、ウェブから翻訳されたテキストをマイニングするプロジェクト“ParaCrawl”を行っています。

今回、IAが収集したウェブアーカイブを“ParaCrawl”プロジェクトに追加することで、マイニング対象となるアーカイブデータが増えることになります。IAでは、アイスランド語・クロアチア語・ノルウェー語・アイルランド語といった翻訳されたテキストが少ない言語を、内部的な分類ツールを用いてIAの通常のウェブアーカイブの中から抽出します。

カナダ・アルバータ大学、Internet Archive(IA)と連携し、大学創設以来の修士論文・博士論文を含む図書館の蔵書のデジタル化作業を実施中

カナダのアルバータ大学がInternet Archive(IA)と連携して、同大学の図書館の蔵書のデジタル化作業の一環として、1908年の大学創設以来の1万4,000点の修士論文・博士論文をデジタル化して公開する作業を行っていることを紹介しています。

これまで、2,200点の博士論文を含む10万2,759点の資料がデジタル化されました。

U of A digitization project aims to make valuable research accessible to all(Folio University of Alberta,2019/3/25)
https://www.folio.ca/u-of-a-digitization-project-aims-to-make-valuable-research-accessible-to-all/

Internet Archive(IA)、米・ボストン公共図書館(BPL)から移管されたSPレコードの音源をデジタル化して公開

2019年3月29日、Internet Archive(IA)が、米・ボストン公共図書館(BPL)からデジタル化及び物理媒体の保存のために移管されたSPレコード(78rpm)5万点を超す音源をデジタル化して公開したと発表しました。

作業期間は18か月で、Internet ArchiveによるSPレコードのデジタル化プロジェクト“Great 78 Project”の中での最大のコレクションとなりました。

デジタル化とあわせて、ボランティアにより、手動及びアルゴリズムを用いて、出版されたディスコグラフィー(目録)との紐付け作業が実施されており、80%以上の音源が、その当時のレビュー情報を保持しているかもしくはリンクがなされています。また、250作品については、米・コネチカットカレッジの楽譜のデジタルコレクションを基に、その曲の楽譜が併せて表示されます。

アイルランド国立図書館(NLI)、2018年に収集したウェブアーカイブコレクション(国民投票・大統領選挙・英国のEUからの離脱)の公開を発表

2019年2月18日、アイルランド国立図書館(NLI)が、2018年に収集したウェブアーカイブのコレクションを公開していることを発表しています。

Internet Archive(IA)のウェブアーカイブコレクション構築サービス“Archive-It”を用いて公開されており、2018年に同国で行われた、中絶を禁止する憲法条項の改正をめぐる国民投票・大統領選挙や、英国のEUからの離脱(Brexit)に関するウェブサイトが収集・公開されています。

@NationalLibraryofIreland(Facebook,2019/2/18)
https://www.facebook.com/240989225037/posts/10161532440760038/

National Library of Ireland(ARCHIVE-IT)
https://archive-it.org/home/nli

米・バージニア大学、障害のある学生へのアクセシブルな資料提供のためのリポジトリ構築プロジェクトを実施

米・バージニア大学が、障害のある学生へのアクセシブルな資料提供のためのリポジトリ構築を行う2年間の試験プロジェクト“Federating Repositories of Accessible Materials for Higher Education”を実施することを発表しています。

同プロジェクトには、米国の7大学が参加しており、リポジトリの構築によって参加館同士でのアクセシブルな資料作成にかかる作業の重複の解消を図る予定です。リポジトリでは、参加館が作成したテキストのアップロードパスの提供や、認証、コンテンツの検索や選択、ダウンロードが可能になるとしています。

同プロジェクトはアンドリュー・W・メロン財団から100万ドルの助成を受けており、Internet Archive(IA)、HathiTrustやBookshareがリポジトリの構築に協力するとしています。IAのブログ記事によると、リポジトリ機能の提供のほかに、アクセシブルな資料作成のためにIAのコンテンツを提供すると述べています。

E2101 - 2018年IIPC総会・ウェブアーカイブ会議<報告>

国際インターネット保存コンソーシアム(IIPC;CA1893参照)の総会及びウェブアーカイブ会議(WAC;E1819ほか参照)が2018年11月12日から11月15日まで,ニュージーランドの首都ウェリントンにあるニュージーランド国立図書館(NLNZ)で開催された。国立国会図書館(NDL)からは筆者が参加した。NDLからの両会議への参加は2年ぶりである。

Internet Archive(IA)、視覚障害者等への電子書籍サービスのアクセス拡大を発表

2018年10月11日、Internet Archive(IA)が、各種障害者向け電子書籍サービス利用有資格者や、提携機関に所属する視覚障害者等に対して、IAが提供する最新の電子書籍の貸出と、古い電子書籍の無料ダウンロードサービスの利用を可能とすると発表しました。

デジタル録音資料のダウンロードサービスNLS-BRAD、視覚障害者等向けのオンライン図書館Bookshare、カナダ・オンタリオ州大学図書館コンソーシアム(OCUL)が運営するデジタルリポジトリ“Scholars Portal”のサービス利用有資格者や、IAとの提携機関に所蔵している個人が、各サービス等のアカウントやIAの視覚障害者等専用の機関別アカウントを利用して、IAのサービスにログインできるようにするものです。

IAでは、図書館・学校・病院といった団体へも、同サービスへの参加を呼び掛けています。

Internet Archive(IA)によるWikipediaのリンク切れをウェブアーカイブされた情報に置き換える作業、900万件を突破

2018年10月1日、Internet Archive(IA)は、Wikipediaの22言語版に含まれるリンク切れを、Wayback Machineやその他ウェブアーカイブに含まれるアーカイブ版に置き換えた数が、900万を超えたと発表しました。

この10日間の調査では、WikipediaからWayback Machineへのクリック数はGoogleブックスの3倍で、英語版では1日あたり平均2万5千クリックあったとしています。

今後、ウェブアーカイブへの置き換えのスピードを迅速化、ウィキメディア財団のサービスEventStreamsを用いての外部参照情報のアーカイブプロセスの改善、リンクチェック・修正の作業をより多くのウェブページ・電子書籍・学術論文に拡大する方法の検討、研究者・編集者がアーカイブされた情報を利用するための支援方法の調査、等を行っていくとしています。

Internet Archive(IA)、“Internet Arcade”にアーケードゲーム約1,100点を追加

2018年9月21日、Internet Archive(IA)は、アーケードゲームをプレイできる“Internet Arcade”に、1990年代から2000年代のアーケードゲーム約1,100点を追加したと発表しました。

Over 1,100 New Arcade Machines Added to the Internet Arcade(IA,2018/9/21)
http://blog.archive.org/2018/09/21/over-1100-new-arcade-machines-added-to-the-internet-arcade/

Internet Arcade
https://archive.org/details/internetarcade

Internet Archiveの運営する電子書籍提供サイト“Open Library”が全文検索に対応

2018年7月14日、Internet Archiveの運営する電子書籍提供サイト“Open Library”が、400万冊を超すコンテンツへの全文検索が可能となったと発表しています。

Search Full-Text within 4M+ Books(The Open Library Blog,2018/7/14)
http://blog.openlibrary.org/2018/07/14/search-full-text-within-4m-books/

Open Library
https://openlibrary.org/

ページ