2021年10月19日、Internet Archive(IA)が、学術論文のためのデータベースInternet Archive Scholar(IA Scholar)の引用索引“Refcat”の公開を発表しました。
発表によると、今回公開された“Refcat”データセットには、IA Scholarに蓄積されている6,000万件以上のメタデータおよび1億2,000万以上の学術的成果物から抽出された、13億件以上の引用情報が含まれています。データセットはクリエイティブ・コモンズ・ライセンスのCC0により提供されています。
また、データの抽出や照合のために作成されたツールもオープンソースで提供されており、プロジェクトの技術的な詳細をまとめたホワイトペーパーがプレプリントサーバarXivで公開されているとあります。
Internet Archive Releases Refcat, the IA Scholar Index of over 1.3 Billion Scholarly Citations(Internet Archive Blogs, 2021/10/19)
https://blog.archive.org/2021/10/19/internet-archive-releases-refcat-the-ia-scholar-index-of-over-1-3-billion-scholarly-citations/
refcat Citation Graph (2021-07-28)(IA)
https://archive.org/details/refcat_2021-07-28
Refcat: The Internet Archive Scholar Citation Graph(arXiv)
https://arxiv.org/abs/2110.06595
参考:
Internet Archiveによる学術論文のためのデータベース、Internet Archive Scholar(記事紹介)
Posted 2020年9月30日
https://current.ndl.go.jp/node/42114