Semantic Scholar、コーパスの全てのデータへのアクセスを可能とする新たなデータセットを提供開始

2022年5月18日、Semantic Scholarが、コーパス“Semantic Scholar Academic Graph”(S2AG)の全てのデータへのアクセスを可能とする新たなデータセット“Academic Graph Datasets”を提供開始したと発表しました。

発表の中では、これまでユーザにS2AGの活用を推奨してきたものの、Academic Graph APIとデータセットの不一致が発生していたことが述べられています。今回提供開始した“Academic Graph Datasets”には、タイトル・著者といった論文の属性、h-index等の著者の属性、引用に関するメタデータの他、抄録のテキスト、オープンアクセスのPDFから抽出された全文テキストである“S2ORC”等が含まれているとあります。

New Academic Graph Datasets Released From Semantic Scholar(AI2 Blog, 2022/5/18)
https://blog.allenai.org/new-academic-graph-datasets-released-from-semantic-scholar-18b6b3b3140e

参考:
E2394 – 学術文献検索サービスSemantic Scholarと自動要約機能
カレントアウェアネス-E No.414 2021.06.10
https://current.ndl.go.jp/e2394