E1231 – 機関内のMLAコレクションに対する統合検索を導入するために

カレントアウェアネス-E

No.203 2011.10.27

 

 E1231

機関内のMLAコレクションに対する統合検索を導入するために

 

 2011年8月,OCLCの研究部門OCLC Researchが,一機関内における博物館・図書館・文書館(MLA)コレクションの統合検索をテーマとした“Single Search: The Quest for the Holy Grail”というレポートを公開した。これは,統合検索の導入に成功した機関の経験を共有することを目的とし,英ヴィクトリア&アルバート博物館や米ゲッティ・リサーチ・インスティチュート等9つの機関のメンバーによるディスカッションによる考察をまとめたものである。

 このテーマを扱うことについて,OCLC Research内部では,最終目標は組織単位の統合検索ではなく研究者が日常的に活動している環境からコンテンツへアクセス可能にすることであるべきだという反対意見も出たが,助成機関等に対して組織のコレクションの豊かさを示すことができるという大切な動機もある等とその重要性を主張する声も多くあったとしている。

 同レポートの内容は,大きく分けて「組織」「技術」「メタデータ」「アクセス」の4つにまとめられている。

 「組織」に関しては,まず,統合検索を導入する目的について述べられている。ディスカッションではユーザのニーズに応えるという動機が第一に挙げられた。その他,図書館員やアーキビスト等の異なる慣習を持つ組織内の様々なスタッフが,統合検索によって組織全体のコレクションを俯瞰できるようになってコレクションへの理解が深まり,その結果,業務の合理化につながるという点も示されたという。この節では,組織構造や組織文化から生じる事情や,助成金獲得等の資金面についても触れられている。

 続いて「技術」について,統合検索システムの形態には次の4種類が存在すると整理されている。(1)単一のシステムに全てのデータを投入する方法。これはMLAのいずれか1つの比重が大きい場合には最良の選択肢かもしれない。(2)別途用意した中央リポジトリで各データベースのデータをハーベストする(集める)方法。ハーベストのためにデータ調整が必要となる。(3)各データベースを横断検索する方法。データ調整は必要ないが,対象データベースが多くなると検索速度が遅くなる。検索結果表示において関連度順ソートやファセット検索が困難といった問題も生じる。(4)各データベースとは別に中央インデクス(central index)を構築する方法。Google等の検索エンジンと同様の方法で,検索速度が速く,ファセット検索も可能である。

 知見として,統合検索を支えるシステムには単一の解があるわけではなく,置かれている状況が違えば異なるアプローチがあり得ると述べ,新しい検索対象データベースを追加できるような拡張性の高いシステムを選択することが必要だとしている。この節では,他に,デジタル資料を管理するためのデジタル資産管理システムや,オープンソースシステムと商用システムの違いについても解説されている。

 「メタデータ」に関しては,それぞれのコレクションを適切に表現するためにMLAで使用されるメタデータ標準の差異を尊重しながら,同時に,ユーザに対してはコレクションの壁を越えたシームレスな検索を提供するのが難しい課題だとしている。また,MLAでは使用される統制語彙に違いがあることや,メタデータを変換するマッピングやクロスウォーク等の手段における課題等についても触れている。

 「アクセス」においてはコレクションのウェブ上での存在感が最も重要だと述べている。そのためのポイントとして,可能ならばプロのデザイナーにウェブデザインを依頼すること,ウェブサイトにおける統合検索の表示位置に注意を払うこと,検索結果ではユーザがデジタル資料にアクセスできるかどうかすぐに分かるようにすること,著作権情報を明示してそのデジタル資料をどのように使用可能なのか理解できるようにしておくこと等が紹介されている。

 最後に,MLAは歴史や慣習等の様々な面で非常に異なる存在ではあるが,ユーザのためにコレクションの発見や利用を容易にしたいと願っているのは同じであると述べ,このレポートが統合検索を導入する際に役立つことを望むと締めくくられている。

Ref:
http://www.oclc.org/research/news/2011-08-22.htm
http://www.oclc.org/research/publications/library/2011/2011-17.pdf
http://www.oclc.org/research/activities/lamsearch/default.htm