米・アレン人工知能研究所(AI2)・米国国立医学図書館(NLM)等の研究組織が共同して新型コロナウイルスに関する機械可読の研究データセット“CORD-19”を公開する

2020年3月16日、米国大統領府科学技術政策局(OSTP)は、アレン人工知能研究所(Allen Institute for AI:AI2)・Facebook創設者ザッカーバーグ(Mark Zuckerberg)氏と夫人のチャン(Priscilla Chan)氏による慈善団体チャン・ザッカーバーグ・イニシアチブ(CZI)・ジョージタウン大学のCenter for Security and Emerging Technology(CSET)・Microsoft社・米国国立医学図書館(NLM)が共同して、新型コロナウイルスに関する研究データセット“COVID-19 Open Research Dataset(CORD-19)”を公開したことを発表しました。

CORD-19は、OSTPの要請により複数の研究組織が共同構築した、新型コロナウイルス感染症、新型コロナウイルス、及びコロナウイルス群に関する学術文献の研究データセットです。OSTPのこのプレスリリースの発表時点で、2万9,000件以上のデータマイニング・テキストマイニング可能な機械可読の論文情報、1万3,000件以上の文献のフルテキストの情報を含んでいます。データセットはAI2の人工知能に関する研究・エンジニアリングのプロジェクトページ“Semantic Scholar”から利用可能で、新しい研究がbioRxiv、medRxiv等のアーカイブサービスや査読付きの出版物で公開された場合には更新されます。

米国政府はデータセット作成機関とともに、国内の人工知能研究者へ新型コロナウイルス感染症に関する優先度の高い科学的問題に科学コミュニティが回答することを支援するマイニング技術の開発を呼びかけています。呼びかけに応じて開発したマイニングツールや得られた知見については、世界中の研究者が自由に利用できるように、機械学習・データサイエンスのコミュニティKaggleのプラットフォームへ提出することが求められています。

Call to Action to the Tech Community on New Machine Readable COVID-19 Dataset(OSTP,2020/3/16)
https://www.whitehouse.gov/briefings-statements/call-action-tech-community-new-machine-readable-covid-19-dataset/

New Dataset Makes Coronavirus Research Open and Machine Readable(CZI,2020/3/16)
https://chanzuckerberg.com/newsroom/new-dataset-makes-coronavirus-research-open-and-machine-readable/

COVID-19 Open Research Dataset (CORD-19)(Semantic Scholar)
https://pages.semanticscholar.org/coronavirus-research

COVID-19 Open Research Dataset Challenge (CORD-19)(Kaggle)
https://www.kaggle.com/allen-institute-for-ai/CORD-19-research-challenge

参考:
米国国立医学図書館(NLM)、同館のオンラインサービスにより「新型コロナウイルス」関連情報の提供を実施:塩基配列データハブ、関連文献の書誌情報一覧、一般向け情報の提供やMeSH補足用語への追加等
Posted 2020年2月4日
https://current.ndl.go.jp/node/40147

米国国立医学図書館(NLM)、医学件名標目表(MeSH)の補足用語(Supplementary Concept Record)として“COVID-19(「新型コロナウイルス感染症」)”を追加
Posted 2020年2月19日
https://current.ndl.go.jp/node/40280

米・国立生物工学情報センター(NCBI)、新型コロナウイルスに関する最新学術文献をキュレーションした情報ハブとして“LitCovid”を公開
Posted 2020年3月17日
https://current.ndl.go.jp/node/40522

※本文の一部を修正しました(2020/6/22 17:15)