人文学オープンデータ共同利用センター(CODH)、現代日本語を古活字(くずし字)に変換するサービス「そあん(soan)」を公開

2023年8月7日、人文学オープンデータ共同利用センター(CODH)が、現代日本語を古活字(くずし字)に変換するサービス「そあん(soan)」を公開したと発表しました。

CODHのウェブサイトによると、古活字データセットの古活字画像を用いて現代日本語テキストを描画するJavaScriptライブラリ「そあん(soan)ライブラリ」を活用したサービスです。現代日本語をサーバに送信すると、ウェブサイトで共有可能な古活字の画像を生成する「サーバ共有型サービス」と、ウェブブラウザ上で同様の画像を生成する「ブラウザ完結型サービス」が公開されています。古活字データセットは改良を加えた公開版を後日ダウンロードできるようにする予定であるとしています。

また、「そあん」の活用事例として、現代ニュースをくずし字に変換して表示する「edomi ニュース」や、くずし字について学べる「edomi 学び」も公開されています。

ニュース(CODH)
http://codh.rois.ac.jp/news/
※2023年8月7日付けで「そあん(soan):現代日本語を古活字(くずし字)に変換するサービスおよびそあん(soan):現代日本語を古活字(くずし字)で描画するライブラリを公開しました。また「そあん」の応用例として、edomi ニュースおよびedomi 学びを公開しました。」とあります。

そあん(soan)(CODH)
http://codh.rois.ac.jp/soan/

edomi ニュース
http://codh.rois.ac.jp/edomi/news/

edomi 学び
http://codh.rois.ac.jp/edomi/learning/

参考:
人文学オープンデータ共同利用センター(CODH)、「つくし」プロジェクトのページを公開:くずし字資料の自動テキスト化、現代文・英語翻訳などの可能性を探る [2023年07月12日]
https://current.ndl.go.jp/car/184992

人文学オープンデータ共同利用センター(CODH)、AIくずし字認識アプリ「みを(miwo)」を公開 [2021年8月30日]
https://current.ndl.go.jp/node/44703

E2179 – AI技術を取り入れた「くずし字翻刻学習・指導システム」
カレントアウェアネス-E No.377 2019.10.10
https://current.ndl.go.jp/e2179

E2353 – みんなで翻刻:歴史資料の市民参加型翻刻プラットフォーム
カレントアウェアネス-E No.408 2021.02.18
https://current.ndl.go.jp/e2353

CA2015 – 動向レビュー:くずし字資料の解読を支援するデジタル技術 / 橋本雄太
カレントアウェアネス No.351 2022年03月20日
https://current.ndl.go.jp/ca2015