国立国語研究所、書籍やブログなどから抽出した1億語の現代日本語コーパスを検索できる「中納言」を公開

2011年8月9日、国立国語研究所が「現代日本語書き言葉均衡コーパス」をオンラインで検索できるツール「中納言」を公開しました。短単位、長単位、文字列の3つの方法による検索ができるのが特徴だそうです。「現代日本語書き言葉均衡コーパス」は人間文化研究機構国立国語研究所が構築した現代日本語のコーパスで、書籍、雑誌、新聞、白書、教科書、広報紙、Webの掲示板、ブログなどから抽出した約1億語の日本語が含まれているそうです。中納言を利用するには書面による申請が必要とのことですが、検索機能が限定された「少納言」は申請の必要なく利用できるようです。

中納言
http://chunagon.ninjal.ac.jp/

少納言
http://www.kotonoha.gr.jp/shonagon/

国立国語研究所
http://www.ninjal.ac.jp/