Internet Archive、学術論文のためのデータベースInternet Archive Scholarの引用索引“Refcat”を公開

2021年10月19日、Internet Archive(IA)が、学術論文のためのデータベースInternet Archive Scholar(IA Scholar)の引用索引“Refcat”の公開を発表しました。

発表によると、今回公開された“Refcat”データセットには、IA Scholarに蓄積されている6,000万件以上のメタデータおよび1億2,000万以上の学術的成果物から抽出された、13億件以上の引用情報が含まれています。データセットはクリエイティブ・コモンズ・ライセンスのCC0により提供されています。

また、データの抽出や照合のために作成されたツールもオープンソースで提供されており、プロジェクトの技術的な詳細をまとめたホワイトペーパーがプレプリントサーバarXivで公開されているとあります。

Internet Archive Releases Refcat, the IA Scholar Index of over 1.3 Billion Scholarly Citations(Internet Archive Blogs, 2021/10/19)
https://blog.archive.org/2021/10/19/internet-archive-releases-refcat-the-ia-scholar-index-of-over-1-3-billion-scholarly-citations/

refcat Citation Graph (2021-07-28)(IA)
https://archive.org/details/refcat_2021-07-28

Refcat: The Internet Archive Scholar Citation Graph(arXiv)
https://arxiv.org/abs/2110.06595

参考:
Internet Archiveによる学術論文のためのデータベース、Internet Archive Scholar(記事紹介)
Posted 2020年9月30日
https://current.ndl.go.jp/node/42114