2022年3月22日、凸版印刷株式会社が、くずし字認識コンペティション「くずし字認識チャレンジ」の開催を発表しました。
開催の目的として、人工知能(AI)技術者の知見を結集し、同社のくずし字の光学文字認識(OCR)技術に新たな視点によるAI技術を取り入れ、高度化することを挙げています。テーマは、ページ画像から行領域を抽出する技術に関する「行領域認識部門」と行画像のテキスト認識を行う技術に関する「行内文字認識部門」の2つです。
また、データセットとして、人文学オープンデータ共同利用センター(CODH)が公開する「日本古典籍くずし字データセット」を加工して利用すると述べています。募集期間は、3月22日から5月23日です。
凸版印刷、くずし字認識コンペティションを開催(凸版印刷株式会社, 2022/3/22)
https://www.toppan.co.jp/news/2022/03/newsrelease220322_1.html
参考:
くずし字認識に関する全世界的なコンペティションが機械学習コンペプラットフォームKaggleで開催
Posted 2019年7月12日
https://current.ndl.go.jp/node/38580
人文学オープンデータ共同利用センター(CODH)、日本古典籍くずし字データセットに字形データを大幅に追加:データセットを活用した無料のAIくずし字OCRサービスも公開
Posted 2019年11月12日
https://current.ndl.go.jp/node/39489
凸版印刷、江戸期以前のくずし字を高精度でテキストデータ化する新方式OCR技術を開発
Posted 2015年7月3日
https://current.ndl.go.jp/node/28820
E2179 – AI技術を取り入れた「くずし字翻刻学習・指導システム」
カレントアウェアネス-E No.377 2019.10.10
https://current.ndl.go.jp/e2179