Google、デジタル化した資料に検索語がどのように表れるかをグラフ化するツール“Google Books Ngram Viewer”を公開

2010年12月16日、米国のGoogleが、Google Labs内に“Google Books Ngram Viewer”というツールを公開したようです。Googleの説明によると、この“Google Books Ngram Viewer”は、Googleによる図書のデジタル化によって得られた一部のデータを基に、ある単語や文章が、1500年から2008年までの資料にどのように表れていたかをグラフで確認することができるものとのことです。提供されているデータセットは、中国語、英語、フランス語、ドイツ語、ロシア語、そしてスペイン語の520万タイトルの資料から、5000億の単語を集積したコーパスに基づくものとのことで、データセット自体もダウンロードすることが可能のようです。

Google Books Ngram Viewer
http://ngrams.googlelabs.com/

Find out what’s in a word, or five, with the Google Books Ngram Viewer (2010/12/16付け Official Google Blogの記事)
http://googleblog.blogspot.com/2010/12/find-out-whats-in-word-or-five-with.html

Scholars Elicit a ‘Cultural Genome’ From 5.2 Million Google-Digitized Books (2010/12/16付け Chronicle of Higher Educationの記事)
http://chronicle.com/article/Scholars-Elicit-a-Cultural/125731/

Humanities Research: Data Visualization: New From Google Labs: The Ngram Google Books Viewer (2010/12/16付け ResourceShelfの記事)
http://web.resourceshelf.com/go/resourceblog/62695

Google Launches New Book Database (2010/12/16付け New York Timesの記事)
http://www.nytimes.com/2010/12/17/books/17words.html?_r=1&src=twt&twt=nytimesarts