国立国語研究所、音声データ661時間分や転記テキスト752万語等を含む「日本語話し言葉コーパス」第3刷の申込受付を開始

2011年11月28日、国立国語研究所が「日本語話し言葉コーパス」第3刷の受付を開始しました。これは、同研究所が情報通信研究機構・東京工業大学と共同開発した、大量の日本語の自発音声に研究用情報を付加した話し言葉研究用のデータベースで、2004年6月に第1刷が、2008年5月に第2刷が作成されています。第3刷は、17枚のDVDから成り、音声データ661時間分や転記テキスト752万語など17種類のデータ・ツールが含まれているようです。

日本語話し言葉コーパス
http://www.ninjal.ac.jp/csj/

申込方法
http://www.ninjal.ac.jp/csj/apply/

参考:
国立国語研究所、書籍やブログなどから抽出した1億語の現代日本語コーパスを検索できる「中納言」を公開
http://current.ndl.go.jp/node/18854