E904 – 多言語シソーラスの構築と開発のためのガイドライン

カレントアウェアネス-E

No.146 2009.03.25

 

 E904

多言語シソーラスの構築と開発のためのガイドライン

 

 国際図書館連盟(IFLA)分類・索引分科会に設けられた「多言語シソーラスのためのガイドライン」ワーキンググループはこのほど,分科会の承認を経て,標記ガイドラインを刊行した。

 本ガイドラインは,1976年にユネスコから刊行された『多言語シソーラスの構築と開発のためのガイドライン』に替わるものとして,1999年から検討されてきた。その目的は,ユネスコのガイドラインと同名のISO 5964:1985を補完することであり,単一言語のシソーラスを構築する際の一般原則(ISO 2788:1986やANSI/NISO Z39.19:2005など)が議論の前提となっている。

 多言語シソーラスの構築方法としては,一から構築するケースと,既存のシソーラスから構築するケースの2つが考えられる。いずれにおいても,「言語Aにおける語彙Xと,言語Bにおける語彙Yとが,等価ではない」場合に,どのように対応すべきかが大きな問題となる。本ガイドラインでは,主に対称型シソーラス(注)を意識し,語彙Xと語彙Yが等価ではない場合を類型化して,対応策を示している。例えば,(1)語彙Xの示す概念が語彙Yの示す概念よりも広い場合(例:ドイツ語のWissenschaftと英語のScience),(2)語彙Xの示す概念が言語Bでは語彙Yだけではない場合(例:英語のFestivalとドイツ語のFestivalおよびFest),(3)語彙Xと等価な語彙が言語Bには存在しない場合(例:ドイツ語のDiakonisches Werkに相当する英語の語彙はない)などが考えられる。これらに対し,言語Bのシソーラスで語彙Xをそのまま優先語として採用(借用)し語彙Yをその下位語としてスコープノートおよび階層関係で表す方法,複数の優先語を事前結合して使用する方法,人工的に語を作成して使用する方法,後ろにカッコで限定する説明語(句)をつけた形で優先語とする方法などがあると,事例を元に示されている。ただし,対称性を追求せず,人工的な語彙を作成しないで「対応する語彙なし」を認める非対称型シソーラスとする,という解決法も同時に示されている。

 このほか,優先語の形態(品詞,同形異義語の扱い,修飾の方法,合成語など)に関する指針や,既存の各言語の単一言語シソーラスを複数リンクさせて構築するシソーラスにおける優先語の等価性の扱いについても詳述されている。後者においては,欧州国立図書館長会議(CENL)のプロジェクトとしてスイス,英国,フランス,ドイツの4国立図書館が協同で実施している,英語(LCSH),フランス語(RAMEAU),ドイツ語(SWD)の各図書館件名標目表をリンクさせる試み“Multilingual Access to Subjects(MACS)”の例を引きながら,複数の優先語をブール演算子(AND/OR)で組み合わせて等価とする方法(例:LCSHのCycling-Trainingに対して,SWDではRadsport AND Trainingを等価とする)が紹介されている。

 MACSのような,複数のシソーラスや件名標目表をリンクさせることで構築される多言語シソーラスの場合,利用者は自分のなじみのある語彙で,他の言語のコレクションを適切に検索することができる。図書館界でも国を越えた連携プロジェクトが動き始めている昨今,IFLAが刊行した本ガイドラインの活用が望まれる。

注:symmetrical thesaurus.
多言語シソーラスの対象となっているすべての言語で,優先語として採用されている語彙が一対一で対応しており,かつ,優先語同士の階層関係・連想 関係も同一であるシソーラス。非優先語は,必ずしも同一ではない。

Ref:
http://www.ifla.org/VII/s29/pubs/Profrep115.pdf
http://unesdoc.unesco.org/images/0002/000205/020561EB.pdf
http://www.iso.org/iso/iso_catalogue/catalogue_tc/catalogue_detail.htm?csnumber=12159
http://macs.cenl.org/