2024年7月26日、熊本大学とTOPPAN株式会社が、くずし字に対応したAI-OCRを用いて、未解読の古文書の解読に成功したと発表しました。
発表では、同大学が公益財団法人永青文庫から寄託を受けている『細川家文書』のうち、約5万枚の未解読の古文書を解読し、約950万文字のテキストデータを生成することに成功したと述べられています。
今後は、『細川家文書』の解読と分析を進め、江戸時代の社会史研究や熊本における地域防災等への活用を目指すとしています。
熊本大学とTOPPAN、くずし字AI-OCRを活用した古文書の大規模調査のための独自手法を開発(TOPPAN, 2024/7/26)
https://www.holdings.toppan.com/ja/news/2024/07/newsrelease240726_2.html
https://www.holdings.toppan.com/ja/news/2024/07/k3rhjh0000002wqq-att/ToppanPRT_240726_2.pdf
※二つ目のURLはプレスリリース[PDF:5ページ]です。
熊本大学とTOPPAN、くずし字AI-OCR活用した古文書の大規模調査のための独自手法を開発(熊本大学)
https://www.kumamoto-u.ac.jp/whatsnew/zinbun/20240726
参考:
凸版印刷株式会社、古文書を解読するスマホアプリを開発:資料館や大学等と連携し実証実験を開始 [2022年09月15日]
https://current.ndl.go.jp/car/46833
E2179 – AI技術を取り入れた「くずし字翻刻学習・指導システム」
カレントアウェアネス-E No.377 2019.10.10
https://current.ndl.go.jp/e2179
橋本雄太. くずし字資料の解読を支援するデジタル技術. カレントアウェアネス. 2022, (351), CA2015, p. 10-13
https://current.ndl.go.jp/ca2015