国立国会図書館(NDL)、「青空文庫振り仮名注釈付き音声コーパス」を公開

2024年2月7日、国立国会図書館(NDL)のNDLラボが、「青空文庫振り仮名注釈付き音声コーパス」を公式GitHub上で公開したと発表しました。

これは、青空文庫で公開されている著作権保護期間が満了した作品のテキストデータと、視覚障害者情報総合ネットワーク「サピエ」が視覚障害者に提供している音声DAISYデータとを照合して構築した、単語とその読みの情報に関するデータセットです。

青空文庫振り仮名注釈付き音声コーパスの公開について(NDLラボ, 2024/2/7)
https://lab.ndl.go.jp/news/2023/2024-02-07-2/

ndl-lab/hurigana-speech-corpus-aozora(GitHub)
https://github.com/ndl-lab/hurigana-speech-corpus-aozora

参考:
NDLラボ、振り仮名のデータセット「振り仮名注釈コーパス」(2種類)を公開 [2021年09月28日]
https://current.ndl.go.jp/car/44879