全国遺跡報告総覧、類義語およびOCR誤認識用語検索機能を追加

2020年2月15日、奈良文化財研究所が、全国遺跡報告総覧に、類義語およびOCR誤認識用語検索機能を追加したと発表しています。

類義語検索機能は、専門用語の使い方は、専門家の認識や研究史に基づくものの、研究成果を社会に普及する観点からは検索性を確保する必要があることから、用語の類義関係を整理し、内部にシソーラスを構築することで、類義語も含めて検索できるようにしたものです。

OCR誤認識用語検索機能は、印刷物からスキャンした報告書データは、OCR処理によってテキストデータ化されているものの、似ている漢字については誤認識があることから、誤認識されやすい漢字をとりまとめ、専門用語と突合することによって、表記ゆれ専門用語約6万語を生成し、システムに組み込んだものです。

全国遺跡報告総覧:類義語およびOCR誤認識用語検索機能の公開(なぶんけんブログ, 2020/2/15)
https://www.nabunken.go.jp/nabunkenblog/2020/02/ruigigo.html

参考:
全国遺跡報告総覧、「書誌ページQRコード表示機能」等を追加
Posted 2019年11月28日
https://current.ndl.go.jp/node/39609

奈良文化財研究所、全国遺跡報告総覧に登録されている報告書類にDOIを登録
Posted 2017年7月19日
https://current.ndl.go.jp/node/34384

全国遺跡報告総覧、報告書詳細画面に引用表記を表示し「クリップボードにコピーボタン」も追加
Posted 2019年2月12日
https://current.ndl.go.jp/node/37559

CA1936 – 全国遺跡報告総覧における学術情報流通と活用の取り組み / 高田祐一
カレントアウェアネス No.337 2018年9月20日
https://current.ndl.go.jp/ca1936