CA1395 – 多言語主題アクセスの試み−LCSH,SWD/RSWK,RAMEAUのリンク− / 上保佳穂

カレントアウェアネス
No.262 2001.06.20


CA1395

多言語主題アクセスの試み―LCSH,SWD/RSWK,RAMEAUのリンク―

ネットワーク化が進み,国や地域を超えた図書館利用が可能になりつつある今,異なる言語・文化圏に属する複数館の目録を検索する機会も増えている。このとき,一回の操作で複数の目録を横断的に検索することができれば,検索にかかる労力は著しく軽減されるだろう。そこで,図書館界では,Z39.50プロトコルを採用したり,ISBD(国際標準書誌記述)に従うなどデータの標準化に努めてきた。しかし,自然言語によって表される主題(件名)標目言語(Subject Heading Language : SHL)の場合は,その言語の由来する国・地域に固有の歴史や学問体系,そしてそれらの反映でもある文献に基づき作成されることが多いため,文化などによる違いが大きく,横断的な主題検索は難しいといわれる。

この壁を乗り越え,シームレスな主題検索を可能にするための手段の一つに,多言語シソーラスの作成が挙げられる。ISO5964によれば,多言語シソーラスを作成するには,「既存シソーラスの語彙や構造を直接参照せず,新規に作成する」「既存の単一言語シソーラスを翻訳する」「既存の複数言語のシソーラスを併合する」という三つの方法が考えられる。今回紹介するヨーロッパの国立図書館による試みは,第3の方法に相当するものである。

英国図書館(BL),スイス国立図書館,ドイツ図書館,フランス国立図書館の4館からなるワーキンググループは,欧州国立図書館長会議(CENL)の要請を受け,Cobra+というプロジェクトの一環として,「多言語主題アクセスに関する調査研究」を1997年から1999年にかけて行った。この調査研究は,英国・スイスで使用しているLibrary of Congress Subject Headings(LCSH),ドイツのSchlagwortnormdatei/Regeln fur den Schlagwortkatalog(SWD/RSWK),フランス・スイスのRepertoire d'Autorite-Matiere Encyclopedique(RAMEAU)という三つのSHLについて,同値の(ないし最も適合度の高い)標目をリンクする可能性について検討したものであり,具体的な目標と内容は以下のとおりである。

(1) 標目の選択とリンクの方法を確定する。この方法は,他のSHLにも適用可能なものとする。
(2) スポーツ分野と演劇分野で,同値の標目をリンクし,その結果を分析する。
(3) (2)でリンクした標目が実際にどのように適用されるかを調べるため,演劇分野の40タイトルについて,各SHLにより別々に索引語の付与を行い,その結果を比較する。
(4)三つのSHLにより索引語が付与されているさまざまな分野のタイトルについて比較する。

(1)は,(2)以下の作業を進める過程で確立された。まず,SHLごとに各主題を代表する主要な標目を確定し,その後,階層関係に基づき下位の標目を選択し,アルファベット順の標目リストを作成する。次に,そのリストを比較し,1対1および1対2で対応する同値の標目を探すマッチング作業を行う。さらに,標目とストリング(順序性のある複数の主題標目の列。典拠レコード上には存在しない。いわゆる細目付き件名もこれに当たる。)が対応しているものを探す。標目とストリングの対応も認めるのは,SHLによっては,同じ意味の主題を,2単語から構成される1標目で表す場合や,典拠レコード上に異なる標目として存在し,ストリングの形でのみ指示している場合などがあることを考慮したためである。

(2)は,標目の同値度をテストするための作業である。スポーツは,標目形に影響する文化的差異が少ないだろうという理由,演劇は逆に,文化的差異が大きいだろうという理由から選択された。調査の結果,三つのSHLすべてに同値の標目が存在したものが,スポーツ分野では86%,演劇分野では60%,二つのSHLに存在したものが,それぞれ8%,18%,同値の標目が存在しなかったものが,それぞれ6%,22%となった。ほぼ予想通り,文化的影響の大きい演劇での同値率が低く,小さいスポーツでは高かった。また,使用頻度の高い標目の方が,同値の標目を持つ率が高いという結果も得られた。

(3)は,(2)で確定した標目間の同値リンクの有効性を検証する目的で行われたが,演劇分野の27タイトルについて,同値の標目が付与されていた率は85%であった。

(4)では,スポーツと演劇以外の分野で検証するため,既に三つのSHLにより索引語が付与されている多様な分野から選択されたタイトルについて,同値の標目を同定しつつ,索引語を比較した。この結果,包括的なレベルでは対応性があることが認められた。同値とみなされる標目が共通に使用されていた率は29%から56%に分散しており,定義づけが明確な主題分野では高い率を示すという傾向がみられた。

以上の調査の結果,ワーキンググループは,主題分野による偏りはあるにせよ,SHL間の同値リンクは可能であり,この件に関する研究の続行は価値があると結論した。今後は,まず,最も使用度の高い標目に集中し,標目の選択とマッチングの効果的な手順を確定するとともに,階層関係や分類記号を利用して自動的に選択・マッチングを行う機能を備え,既にフランス国立図書館によりLCSHとリンクされているRAMEAUの6万の標目を実装したシステムを開発することが望ましいとした。また,リンクの記録・管理のため,参加機関の典拠ファイルとは別に,独立したメタシソーラスを構築することを提案した。

この研究の最終レポートはCENLに提出された。これを受けて,CENLのプロジェクトとして,リンクの作成・検証・評価のためのプロトタイプシステムの開発に取り組むMACS(Multilingual Access to Subject)プロジェクトが2000年に発足した。同プロジェクトは,同年秋に期限が切れたが,CENLは延長を認め,2001年夏頃に終了する予定である。

現在のところ,英語圏を中心とした大規模図書館では,LCSHが事実上の標準として流通しているが,異なる言語文化圏の間にまで圧倒的な優位を保っているわけではない。単独のSHLによる統一的なアクセスの保障ではなく,今回のように,複数のSHLを並存させつつ統合的なアクセスを目指す方法は,SHLを新規作成したり,共通のSHLにより索引語を付与し直す労力や,そのために起こる目録の非継続による効率の低下を避けるという経済的な理由によるだけではなく,英語によるグローバル化に抵抗し,各国の文化を尊重するヨーロッパ諸国ならではの選択といえよう。日本語を使用して主題作業を行う我々にとっても注目すべき試みと思われる。

上保 佳穂(うわぼよしえ)

Ref: MacEwan, A. Crossing language barriers in Europe: linking LCSH to other subject heading languages. Cat Classif Q 29 (1/2) 199-207, 2000
CoBRA+ working group on multilingual subject access. Final report. [http://www.bl.uk/information/finrap3.html] (last access 2001. 6. 1)
Landry, P. The MACS Project. [http://www.ifla.org/IV/ifla66/papers/165-181e.pdf] (last access 2001. 6. 1)