HathiTrust Research Center、HathiTrustに含まれる全デジタルデータを研究者のテキストマイニング調査のために開放

2016年5月5日、インディアナ大学、イリノイ大学、HathiTrustが共同で運営しているHathiTrust Research Center(HTRC)が、HathiTrustがデジタル化した全ての書籍1,400万点を対象として、研究者がテキストマイニングにより調査できるようにすると発表しました。

これまではパブリックドメインのサブセットのみの分析を支援してきたが、今後は、インディアナ大学のパーベイシブ技術研究所とData to Insight Centerの技術支援により、事前審査を受けた研究者はAdvanced Collaborative Services待遇で調査ができるようになるとのことです。

HTRCの専門家により、2017年春には、全てのコレクションを、カプセル化したデータとして利用可能とするほか、フィーチャデータセットも2016年秋には公開される予定とされています。

Twitter(@HathiTrust,2016/5/5)
https://twitter.com/hathitrust/status/728223923540742149

One of the world’s largest digital libraries opens doors to text mining scholars(HathiTrust)
https://www.hathitrust.org/one-of-worlds-largest-digital-libraries-opens-doors-to-text-mining-scholars

参考:
E1775 – 「HathiTrustとデジタルアーカイブの未来」<報告>
カレントアウェアネス-E No.299 2016.03.03
http://current.ndl.go.jp/e1775

HathiTrustが一新 データマイニング・分析ツールもリリース
Posted 2013年4月23日
http://current.ndl.go.jp/node/23389

HathiTrustを利用した研究のための環境等を提供するHathiTrust Research Centerが開設へ
Posted 2011年4月19日
http://current.ndl.go.jp/node/18036

※タイトルの誤植を修正しました(2016年5月9日)