E1842 – デジタルコンテンツへのアクセス方法を多言語化する

カレントアウェアネス-E

No.311 2016.09.15

 

 E1842

デジタルコンテンツへのアクセス方法を多言語化する

 

 2016年6月,Europeanaは,“White Paper on Best Practices for Multilingual Access to Digital Libraries”を公開した。このホワイトペーパーは,文化遺産のデジタルコンテンツへのアクセス方法を多言語化するための,研究成果・参考文献などのリソースやベストプラクティスを集約している。また,デジタルアーカイブシステムを多言語化する際の課題や,システムの多言語機能の評価方法なども解説している。

 ホワイトペーパーでは,データ,インターフェース,ユーザーとの相互作用という,システムの3つの構成要素に焦点があてられているので,本稿ではそれに従い,コンテンツへのアクセス方法を多言語化する方策について紹介する。

◯データ
 まず,メタデータの記述言語を明確に示す。これはメタデータが複数の言語で記述されているとき特に有効である。また,メタデータの記述に多言語の語彙を使用する。単一の言語の語彙を使用する場合は,他の言語あるいは多言語の語彙へマッピングしたり,語彙自体を他の言語に翻訳したりする。とくに語彙の翻訳は,他の言語のリソースが存在しないきわめて専門的なコンテンツに対して有効である。そもそも,メタデータやコンテンツ自体を翻訳して多言語化することもありうる。

◯インターフェース
 ヘルプや問い合わせなど,静的な内容のウェブページの翻訳は,まず最初に着手すべきことであり,また簡単に行える。プロの翻訳者を雇い,原文をその翻訳者の母国語に翻訳してもらうのがよい。それが無理なら,ネイティブスピーカーに校正してもらう。翻訳サービスの要件を定めた国際標準(ISO 17100:2015)もあるので活用する。

 可能であれば自動検出機能を使用して,ユーザーの使用言語を検出する。また,ユーザーが使用言語を容易に選択できるようにして,その設定を保存する。これらにより,インターフェースや静的なウェブページの言語を変更する。使用言語の選択に際しては,言語を国旗で示すのではなく,その言語による言語名(日本語なら「日本語」,英語なら“English”,中国語なら「中文」,韓国語なら「한국어」)あるいは国際標準の言語コードの規定(ISO 639-2:1998)などに従い表示すべきである。また,検索結果が多言語のコンテンツで構成される場合,異なる言語のコンテンツを混在させて表示することは避ける。

◯ユーザーとの相互作用
 検索語のオートコンプリートやサジェスト機能は,その言語を理解できるユーザーに有効である。また,自動翻訳機能を活用して,ユーザーが入力した検索語と翻訳された検索語をOR検索する。翻訳の際は,翻訳元・翻訳先の言語の決定や,システムが提案する複数の翻訳候補からの選択などにユーザーが関与できるようにすべきである。

 ブラウジングはコンテンツを視覚的に一覧できるという点で言語に依存しておらず,探す意図がなかったコンテンツを偶然に発見することが可能になる。

 検索やブラウジングの際に,コンテンツを言語別にフィルタリングすることで,ユーザーが理解できない言語のものを除くことができる。フィルタリングの方法を説明する言語をユーザーが選択できるようにすることや,フィルタリングする言語はコンテンツの言語かメタデータの言語かを明確に示すことが重要である。

 これら以外にコンテンツへアクセスする方法として,時系列に沿って表示したり地図上に表示したりするなど,言語に依存しない方法もある。

 そのほか,ウェブページをさまざまな言語で用意して,検索エンジンの検索結果にそのユーザーにとって適切な言語のページを表示させることや,検索エンジンから,自身が理解できない言語のページを訪問したユーザーのために,ページの言語を切り替えるプルダウンメニューなどの機能を見つけやすくすることが重要である。

 ソーシャルメディアやタグ付けによって,ユーザーにコンテンツを翻訳したり多言語のタグを付与してもらったりすることがあるが,その場合,オートコンプリートによって統制されたタグを付与するよう誘導したり,ユーザーによる翻訳であるときはそのことを明確に示したりすることが重要である。

◯おわりに
 多言語化は,コンテンツへのアクセスにおいて言語の障壁を乗り越えるひとつの手段であるが,このホワイトペーパーでは,多言語化のほかに非言語的なアクセス方法も紹介している。米国では,スマートフォン向けのゲームアプリ「ねこあつめ」が,メニュー等が日本語で表示されるにもかかわらず,日本語が理解できなくてもプレイできる非言語的なインターフェースも持っていることが話題となった。デジタルアーカイブでも多言語化や非言語的なアクセスを実現して言語の障壁を乗り越えるために,このホワイトペーパーが重要な役割を果たすであろう。

関西館図書館協力課・阿部健太郎

Ref:
http://pro.europeana.eu/files/Europeana_Professional/Publications/BestPracticesForMultilingualAccess_whitepaper.pdf
http://www.iso.org/iso/catalogue_detail.htm?csnumber=59149
http://www.iso.org/iso/catalogue_detail?csnumber=4767
http://www.loc.gov/standards/iso639-2/
http://acrlog.org/2015/06/15/collecting-cats-library-lessons-from-neko-atsume/