2017年3月7日、国立国語研究所(国語研)が、「国語研日本語ウェブコーパス」の検索系「梵天」を一般公開しました。
「国語研日本語ウェブコーパス」は、ウェブ(WWW)上の日本語テキストを利用して現代日本語コーパスを構築したもので、稀言語現象の言語学的、心理学的および情報処理的視点からの究明の可能性を開くことを目的としており、検索系「梵天」に格納して公開されました。
一般公開版の利用者は、文字列検索のみが可能で、インデックス情報のダウンロードなどはできないほか、利用規約に同意する必要があります。
その他、高機能版もあり、品詞列検索・係り受け検索が利用でき、インデックス情報などがダウンロードできますが、利用するためには、利用規約への同意、書籍やブログなどから抽出した1億語の現代日本語コーパスを検索できる「中納言」のアカウントの保持と半年以上の利用経験、国語研が開催する「梵天」講習会への参加、が必要です。
国語研日本語ウェブコーパス 利用申込(国語研)
http://pj.ninjal.ac.jp/corpus_center/nwjc/subscription.html
※「2017年3月7日に「国語研日本語ウェブコーパス」の検索系「梵天」の一般公開を行いました。」とあります。
258億語の日本語コーパスをウェブで公開~国立国語研究所(Internet Watch,2017/3/6)
http://internet.watch.impress.co.jp/docs/news/1047913.html
国語研日本語ウェブコーパス(国語研)
http://bonten.ninjal.ac.jp/
参考:
国立国語研究所、ひまわり版「洒落本コーパス」(Ver.0.5,短単位情報付き)とひまわり版「人情本コーパス」(Ver.0.1,テキスト検索のみ)を公開
Posted 2015年10月28日
http://current.ndl.go.jp/node/29796
国立国語研究所、「日本語歴史コーパス」(先行公開版)を公開
Posted 2012年12月26日
http://current.ndl.go.jp/node/22590
国立国語研究所、書籍やブログなどから抽出した1億語の現代日本語コーパスを検索できる「中納言」を公開
Posted 2011年8月10日
http://current.ndl.go.jp/node/18854
国立国語研究所、KOTONOHA「現代日本語書き言葉均衡コーパス」をオンライン試験公開
Posted 2007年5月29日
http://current.ndl.go.jp/node/5918