2024年11月26日、国立国会図書館(NDL)のNDLラボが、NDL古典籍OCR-Liteを公式GitHub上で公開したと発表しました。
ノートパソコン等の一般的な家庭用コンピューターやOS環境で、江戸期以前の和古書、清代以前の漢籍といった古典籍資料のデジタル化画像からテキストデータが作成できる軽量なOCR(光学的文字認識)です。
NDL古典籍OCR-Liteの公開について(NDLラボ, 2024/11/26)
https://lab.ndl.go.jp/news/2024/2024-11-26/
ndl-lab/ndlkotenocr-lite(GitHub)
https://github.com/ndl-lab/ndlkotenocr-lite
参考:
国立国会図書館(NDL)、NDL古典籍OCR ver.3を公開 [2024年02月08日]
https://current.ndl.go.jp/car/210095