米・アレン人工知能研究所(AI2)、PDF形式の科学論文をHTML形式に変換するツールのプロトタイプを公開

米・アレン人工知能研究所(AI2)のニュースレター(2021年9月号)に、記事“Paper to HTML: making science accessible”が掲載されています。同記事では、AI2のLucy Lu Wang氏が率いる研究者・エンジニアチームが、PDF形式の科学論文をHTML形式に変換するツール“Paper to HTML”を新たに公開したことを紹介しています。

同ツールのウェブサイトに掲載されている紹介文によれば、Semantic Scholarが作成した「実験的プロトタイプ」(experimental prototype)であり、科学論文をHTMLで表示しスクリーンリーダーやモバイル機器で読みやすくすることを目的としています。現在PDF以外にLaTeXソース、JATS XMLに対応しています。

また、統計的な機械学習技術を用いて論文からコンテンツを抽出しているため、誤りは避けられないとし、品質向上のための方法を模索していると述べています。

AI2 Newsletter(September 2021)(AI2)
https://allenai.org/newsletters/archive/2021-09-newsletter.html

Paper to HTML
https://papertohtml.org/

About Paper to HTML(Paper to HTML)
https://papertohtml.org/about

Paper Example Gallery(Paper to HTML)
https://papertohtml.org/gallery
※同ツールの適用例を公開しているページです。

参考:
E2394 - 学術文献検索サービスSemantic Scholarと自動要約機能
カレントアウェアネス-E No.414 2021.06.10
https://current.ndl.go.jp/e2394