2026年3月4日、スウェーデン王立図書館(NLS)が、大規模な音声の自動文字起こしを行うツール“easytranscriber”のリリースを発表しました。
easytranscriberは、NLSが2025年にリリースした音声をテキストに変換するAIモデル“KB-Whisper”と、Facebook AI Research(FAIR)が2020年に発表したラベルのない(文字起こし文がない)データを学習に利用できる「自己教師あり学習」が可能なモデル“wav2vec 2.0”(Wav2vec2)の長所を組み合わせたものとしています。
easytranscriberを用いると、単語レベルの正確なタイムスタンプを取得可能で、大規模な音声コレクションの検索性やアクセス性を向上させたい機関などに適しているとしています。
Easytranscriber – nytt verktyg för att transkribera tal till text(NLS, 2026/3/4)
https://www.kb.se/om-oss/nyheter/nyhetsarkiv/2026-03-04-easytranscriber—nytt-verktyg-for-att-transkribera-tal-till-text.html
easytranscriber: Speech recognition with precise timestamps(The KBLab Blog, 2026/2/26)
https://kb-labb.github.io/posts/2026-02-26-easytranscriber/
kb-labb/easytranscriber(GitHub)
https://github.com/kb-labb/easytranscriber
参考:
スウェーデン王立図書館、スウェーデン語の音声をテキストに変換するAIモデル“KB-Whisper”を開発 [2025年02月26日]
https://current.ndl.go.jp/car/241249
