Internet Archive、収集済のウェブアーカイブからロングテールなオープンアクセス論文を自動的に判別し保存する方法を開発するためのプロジェクトを開始

2018年3月5日、Internet Archive(IA)が、アンドリュー・W・メロン財団からの助成を得て、ロングテールなオープンアクセス(OA)論文の保存を目的としたプロジェクト“Ensuring the Persistent Access of Long Tail Open Access Journal Literature”を開始すると発表しました。

IAや連携機関の収集済ウェブアーカイブから、保存が危ぶまれているロングテールなOA論文を自動的に判別し、適切なメタデータを付与する仕組みを検証するもので、検証にあたっては、(1)ISSN、DOAJ、Unpaywall、CrossRefからOA論文のデータを取得し該当する論文を調べる、(2)ウェブアーカイブからジャーナルに該当するコンテンツを特定したうえで、識別子やメタデータと関連付けて発見可能性を高める、の2つの手法が用いられます。

また検証の成果の活用のため、結果を受けてトレーニングセットを開発し、小規模なウェブアーカイブで試験してその効果を評価するとともに、この取組に必要な経費の算出も行われます。

Andrew W. Mellon Foundation Awards Grant to the Internet Archive for Long Tail Journal Preservation(IA,2018/3/5)
https://blog.archive.org/2018/03/05/andrew-w-mellon-foundation-awards-grant-to-the-internet-archive-for-long-tail-journal-preservation/

Ensuring the Persistent Access of Open Access Journal Literature(Andrew W. Mellon Foundation)
https://mellon.org/grants/grants-database/grants/internet-archive/1710-04980/