スウェーデン王立図書館（NLS）、大規模な音声の自動文字起こしツール“easytranscriber”をリリース

2026年3月4日、スウェーデン王立図書館（NLS）が、大規模な音声の自動文字起こしを行うツール“easytranscriber”のリリースを発表しました。

easytranscriberは、NLSが2025年にリリースした音声をテキストに変換するAIモデル“KB-Whisper”と、Facebook AI Research（FAIR）が2020年に発表したラベルのない（文字起こし文がない）データを学習に利用できる「自己教師あり学習」が可能なモデル“wav2vec 2.0”（Wav2vec2）の長所を組み合わせたものとしています。

easytranscriberを用いると、単語レベルの正確なタイムスタンプを取得可能で、大規模な音声コレクションの検索性やアクセス性を向上させたい機関などに適しているとしています。

Easytranscriber – nytt verktyg för att transkribera tal till text（NLS, 2026/3/4）
https://www.kb.se/om-oss/nyheter/nyhetsarkiv/2026-03-04-easytranscriber—nytt-verktyg-for-att-transkribera-tal-till-text.html

easytranscriber: Speech recognition with precise timestamps（The KBLab Blog, 2026/2/26）
https://kb-labb.github.io/posts/2026-02-26-easytranscriber/

kb-labb/easytranscriber（GitHub）
https://github.com/kb-labb/easytranscriber

参考：
スウェーデン王立図書館、スウェーデン語の音声をテキストに変換するAIモデル“KB-Whisper”を開発 [2025年02月26日]
https://current.ndl.go.jp/car/241249

図書館界、図書館情報学に関する最新の情報をお知らせする、国立国会図書館のサイトです。

メインメニュー

スウェーデン王立図書館（NLS）、大規模な音声の自動文字起こしツール“easytranscriber”をリリース

メインメニュー

現在地

類似の記事