2025年2月17日、国立国会図書館(NDL)が視覚障害者等を対象として「みなサーチ」(国立国会図書館障害者用資料検索)で提供している、デジタル化資料の全文テキストデータが300万点を超えたと発表しました。
全文テキストデータとは、NDLの所蔵資料をデジタル化した画像データから、OCR(光学的文字認識)処理により作成したテキストデータです。
全文テキストデータの対象資料は、図書については1987年までに出版されたもの、雑誌については2000年までに出版されたものが中心で、博士論文なども含まれています。順次テキスト化を進めており、提供点数は、2024(令和6)年度末までに、合計約322万点になる見込みです。
視覚障害者等の方への全文テキストデータの提供点数が300万点を超えました(NDL, 2025/2/17)
https://www.ndl.go.jp/jp/news/fy2024/250217_01.html
参考:
E2608 ― 国立国会図書館障害者用資料検索「みなサーチ」β版の紹介
カレントアウェアネス-E No.459 2023.06.29
https://current.ndl.go.jp/e2608