国立国会図書館、「次世代デジタルライブラリー」の全文検索対象を古典籍資料に拡大:江戸期以前のくずし字資料等約6万点が追加

2022年11月1日、国立国会図書館(NDL)のNDLラボは、「次世代デジタルライブラリー」の全文検索対象を古典籍資料に拡大すると発表しました。

発表の中では、デジタル化済み古典籍資料の一部である、江戸期以前のくずし字資料等約6万点の光学文字認識(OCR)全文テキストデータを追加したとあります。これは、2021年度に実施したOCR関連事業の知見等を踏まえ、NDLの次世代システム開発研究室が内製で開発したOCRソフトウェアで作成されたデータです。

また、2022年内を目途に、ほぼ全てのデジタル化済みの古典籍資料へ対象を拡大し、古典籍資料及び図書資料約35万点の全文検索が可能となる予定であるとしています。

「次世代デジタルライブラリー」の全文検索対象を古典籍資料にも拡大しました(NDLラボ, 2022/11/1)
https://lab.ndl.go.jp/news/2022/2022-11-01/

古典籍資料のOCRテキスト化実験(NDLラボ)
https://lab.ndl.go.jp/data_set/r4ocr/r4_koten/

参考:
国立国会図書館、「次世代デジタルライブラリー」の全文検索対象を著作権保護期間満了図書資料全件に拡大
Posted 2022年3月25日
https://current.ndl.go.jp/node/45871

国立国会図書館、「次世代デジタルライブラリー」の全文検索対象拡大と画像検索機能改善を実施
Posted 2022年2月1日
https://current.ndl.go.jp/node/45575

E2533 – NDL Ngram Viewerの公開:全文テキストデータ可視化サービス
カレントアウェアネス-E No.442 2022.09.01
https://current.ndl.go.jp/e2533

E2154 – 国立国会図書館,次世代デジタルライブラリーを公開
カレントアウェアネス-E No.372 2019.07.11
https://current.ndl.go.jp/e2154