Internet Archive

Internet Archive、学術論文のためのデータベースInternet Archive Scholarの引用索引“Refcat”を公開

2021年10月19日、Internet Archive(IA)が、学術論文のためのデータベースInternet Archive Scholar(IA Scholar)の引用索引“Refcat”の公開を発表しました。

発表によると、今回公開された“Refcat”データセットには、IA Scholarに蓄積されている6,000万件以上のメタデータおよび1億2,000万以上の学術的成果物から抽出された、13億件以上の引用情報が含まれています。データセットはクリエイティブ・コモンズ・ライセンスのCC0により提供されています。

また、データの抽出や照合のために作成されたツールもオープンソースで提供されており、プロジェクトの技術的な詳細をまとめたホワイトペーパーがプレプリントサーバarXivで公開されているとあります。

Internet Archive(IA)、公共図書館を対象とした地域の歴史のウェブアーカイブ構築支援プログラム“Community Webs”に新たに約60館が参加すると発表:米国・カナダに加え台湾等

2021年10月18日、Internet Archive(IA)は、地域の歴史のウェブアーカイブ構築を支援するための公共図書館を対象としたプログラム“Community Webs”に、新たに60館以上が参加すると発表しました。

カナダの35館、米国の22館に加え、アルバ、台湾、ナイジェリア、トリニダード・トバゴの各1館が新たな参加館として挙げられています。発表の中では、参加機関が150以上となり、米国外に拡大したと述べています。

E2433 - IAによる地域ウェブ情報収集支援の取組Community Webs

  国立国会図書館では国内のウェブサイトを定期的に収集し,保存,公開する国立国会図書館インターネット資料収集保存事業(WARP)を行っている。国内では,このような取り組みはまだ一般的ではなく,ウェブ上でのみ公開された行政資料を電子的に保存している取り組みを含め,ウェブアーカイブを行っている公共図書館はほとんどない(E2044参照)。一方,米国では世界中のウェブサイトを収集,保存,公開しているInternet Archive(IA)と連携し,近年ウェブアーカイブのプロジェクトを始動した地方の公共図書館がある。本稿では,IAとそれらの図書館の取り組みについて紹介する。

E2434 - ニュージーランド国立図書館の外国資料の除籍とIAへの寄贈

   2021年7月13日,ニュージーランド国立図書館(NLNZ)は,同館の外国刊行資料コレクション(Overseas Published Collections:OPC)のうち除籍予定の書籍の大部分を,国際的なデジタル・ライブラリーを運営する米国の非営利団体Internet Archive(IA)に寄贈すると発表し,賛否の声が上がっている。

本の特徴を把握するためのオープンな基準・データ・サービスを作る“Open Book Genome Project”(記事紹介)

2021年8月24日、Internet Archive(IA)の運営する電子書籍提供サイト“Open Library”に、“Open Book Genome Project”(OBGP)についての記事が掲載されました。

2003年から、本の内容の構成要素を分析するプロジェクト“Book Genome Project”が実施されていました。OBGPの使命として、本の特徴の全体的な把握を可能とするオープンな基準・データ・サービスを生み出す、オープンかつコミュニティに支援された“Book Genome Project”を作ることが掲げられています。

記事の中では、本の推薦、類似点・相違点に基づく本の比較、より正確な要約の作成等のため、一般の人々にとって、本に関するデータをより利用・アクセスしやすいものとすることを目指すと述べています。また、数百万のIAの書籍を読み取り重要な点を抽出するボット“OBGP Sequencer”や、クラウドソーシング型の本レビューのタグ付けシステム“Community Reviews”のアプローチを活用するとあります。

Internet Archive(IA)による全書籍の売り上げデータ10年分の要求に対する大手出版社4社の返答が公開

米国の出版情報誌“Publishers Weekly”の2021年8月13日付の記事で、Internet Archive(IA)が要求した全書籍の売り上げデータ10年分の提供について、Hachette Book Group・HarperCollins社・Wiley社・Penguin Random House社側の返答が公開されたと報じられています。

売り上げデータは、同商業出版社4社がIAの“Controlled Digital Lending(CDL)”による電子書籍貸出の停止を求めて提起した著作権侵害訴訟において、IAの電子書籍貸出が書籍の売り上げに及ぼす影響を検証することを目的に要求されていました。

8月12日付で4社側の弁護士から提出された文書では、法的に意義のある結果が得られず訴訟の遅延をもたらすものであり、原告側への負担が検証により得られる価値を上回るため、要求は却下されるべきであること等が述べられています。

また、書籍は代替可能なものではないため、異なる書籍間での比較は不可能であり、映画化をはじめとしたその他の要因によって売り上げは大幅に変わり得ることから、検証の前提が誤っていると指摘しています。

Internet Archive(IA)、図書館間相互貸借(ILL)のための“IDS Project”に参加

2021年7月27日、Internet Archive(IA)は、図書館間相互貸借(ILL)のための“IDS Project”への参加を発表しました。“IDS Project”は、全米の公共・学術図書館を含む120館が参加するコミュニティであり、各参加館の有する情報資源への相互アクセスの最適化に取り組んでいます。

IAは、“IDS Project”への参加により、自らが所蔵する200万冊の単行書と3,000冊の定期刊行物へのアクセスをILLを通じ提供するとしています。なお、IAは2021年4月にも、ILL調整サービスであるRapidILLとのパイロットプログラムを通じてILLサービスを開始すると発表していました。

Internet Archive(IA)、大手出版社4社の全書籍の売り上げデータ10年分を要求:IAによる電子書籍貸出の書籍の売り上げへの影響を検証するため

米国の出版情報誌“Publishers Weekly”の2021年8月9日付の記事で、Internet Archive(IA)が、Hachette Book Group・HarperCollins社・Wiley社・Penguin Random House社に対し、全書籍の売り上げについて2011年以降の月次データを要求したことが報じられています。

同商業出版社4社がIAの“Controlled Digital Lending(CDL)”による電子書籍貸出の停止を求めて提起した著作権侵害訴訟において、IAの電子書籍貸出が書籍の売り上げに及ぼす影響を検証することを目的に要求されました。

2021年8月9日付でInternet Archive側の弁護士から提出された文書では、出版者側から訴訟対象書籍の売り上げの年次データは提供されたものの、書籍の売り上げの推移には他の要因があることや全書籍分のデータ出力の負担等を理由に、訴訟対象外の書籍の売り上げデータ提供に反対があったと述べられています。

Internet Archiveの25周年を迎えての振り返り(記事紹介)

米国の非営利団体Internet Archiveが25周年を迎えたことを受けて、2021年7月21日付で創設者のケール(Brewster Kahle)氏によるブログ記事が公開されています。ブログ記事では、Internet Archiveができるまで、非営利であること、振り返りと今後の展望について述べられています。

Internet Archiveができるまでとして、ケール氏が若い頃グーテンベルクの発明から前進した新しいメディアをつくることを支援したいと思っていたことなどが述べられています。リッチメディアの大規模コレクションのために機能するコンピュータの構築、ネットワークの発展などがあり、「すべての図書館(library of everything)」が構築されました。

Internet Archiveが非営利であることの理由として、Internet Archiveがすべての人のものを含んでいることが挙げられています。また、Internet Archiveの目標として、「新しいグローバルマインドをつくるために活用できるウェブの永続的なメモリを構築すること」、「経時的なデータから新しい洞察を与えるパターンを発見すること」、「歴史的資料であるだけではなく、インターネットの生きている一部分であること」が挙げられています。

ページ