カレントアウェアネス
No.178 1994.06.20
CA948
平成5年度におけるメディア変換研究チームの実験活動
国立国会図書館では,平成4年8月,業務機械化室の中に「電子図書館研究班」を設置した(CA907参照)。これは,当館が構想し設立の実現をめざしている国立国会図書館関西館(仮称)を想定しながら,研究・開発が著しい電子化技術を中心とした種々の技術の図書館における活用を総合的に調査研究するためであった。
この研究班は,(1)メディア変換研究チームと,(2)主題検索研究チーム,の2チームで構成され,チームごとにテーマを設定して実験・調査・研究を推進して来ている。
ここでは,メディア変換研究チームの平成5年度における実験活動の概略を報告する。
1.実験の目的
1)資料の一部分または全文を電子化(文字情報または画像情報)し,データベースを構築する。
2)上記のデータベースを利用してオンラインによる情報提供サービスの実用化の可能性を実験する。
(平成5年度は,平成4年度のハードウェア,ソフトウェアの技術動向調査を踏まえて,資料の電子化および検索の実用化モデルを作成した。)
2. 実験項目と対象資料
l)文字情報の入力・利用実験(漢字OCR使用),対象資料としては,雑誌・図書の目次,古文書の索引・翻刻,国会法,国会会議録など。
2)画像情報の利用実験(光ファイルシステムのパッケージを利用),対象資料としては,雑誌目次・本文,図書表紙・目次・巻末索引・奥付,古文書本文など。
3)フルテキスト検索,対象資料としては,国会法,国会会議録,古文書抄録,国立国会図書館例規集など。
3. 実験結果
1) については,
- 文字入力の際の操作性…やや難がある。
- 文字認識率の評価…約96.1%
(実用化に耐えうる高認識率であるので,今後はシステム構築の位置づけから研究・実験を進めたい)
2) については,
- 入力の際の操作性…容易性はあるが,もう少しユーザフレンドリーになるように要望したい。
- 画像情報の解象度…情報の確認としてはよい。
3) については,
- 操作性,検索速度としては申し分ないが,今後どのようにしてテキストデータをレコード単位に分け,ファイル構築をしていくのがよいか,を利用面から検討していきたい。
- 画像情報とのリンクでは,取り出しに時間がかかりすぎるので伝送方式について検討する必要がある。
田村貴代子(たむらきよこ)