E1688 – Europeanaによるメタデータの品質に関する報告書

カレントアウェアネス-E

No.284 2015.07.09

 

 E1688

Europeanaによるメタデータの品質に関する報告書

 

 Europeanaは,2015年5月,メタデータの品質に関する報告書“Report and Recommendations from the Task Force on Metadata Quality”(以下報告書)を公開した。これは,2013年12月に設置されたメタデータの品質に関するタスクフォースの活動の成果である。

 Europeanaには欧州の3,000を超える機関からのメタデータが集積されているが,メタデータの品質が切迫した問題となっている。報告書では,メタデータの品質に大きな影響を及ぼす7の要因を定義し,品質改善のための提言をしている。

 ●高品質のメタデータの定義

 報告書では,高品質のメタデータを,次の7点で定義している。

 (1)信頼できるプロセスを経て作成されていること
 (2)発見可能性があること
 (3)可読性があること
 (4)標準化されていること
 (5)利用者にとって有意義なこと
 (6)再利用に問題がないこと
 (7)可視性があること

 とくに,(1),(2),(5)について重点的に解説されている。

 (1)メタデータが作成されてからEuropeanaに届くまでのメタデータ処理プロセスは多いが,どのプロセスにおいてもメタデータのフォーマット変換によるデータの損失は最小限でなければならず,すべてのプロセスが信頼できるものでなければならないとしている。プロセスの信頼性を向上させるために,アグリゲータがデータ提供機関とコミュニケーションを密にし,プロセスの透明性を向上させることを提言しており,データの追加のような,単純なマッピング以外の作業を行わないことも必要だとしている。

 Europeana Data Model(EDM)に関する既存のドキュメントを,対象とする利用者の観点から改訂すべきことも提言している。メタデータのクロスウォーク(CA1552参照)についても,音声など各種コンテンツのメタデータをEDMにマッピングする際の経験や問題を,文書化して広く共有することで信頼性が向上するとしている。

 (2)発見可能性を向上させるものとして,クロスウォークによる標準化されたマッピング,関連キーワードの使用,タイトルなどコンテンツを一意に特定できる記述,オンライン語彙のURIなど一意で永続的な識別子の付与,階層構造によりコレクションにおけるコンテンツの位置づけを明確化すること,などを挙げている。タイトルのような必須のフィールドは詳細に記述すること,Linked Open Dataの語彙を使用してメタデータを記述することも提言している。

 (5)人間が理解できるようにメタデータを詳細に記述したり,コレクションのコンテンツは精選して各コンテンツに位置づけを追記したりすることで,利用者にとって有意義なメタデータとなるとしている。

 また(7)についても,検索結果一覧から見つけやすくするために,音声や映像を含めたあらゆる種類のコンテンツにサムネイル画像を付与することを提言している。

●Europeanaによるメタデータの品質の評価

 メタデータの品質を最低限維持するために,EDMが9の必須エレメントを規定していることが紹介されている。とくに,透明性が高まるとして,Europeana aggregation teamによるメタデータの品質確認のプロセスが明らかにされており,次のような流れとなっている。

 ・データセットから抽出したサンプルをEDM XMLの生データで確認する。
 ・フィールドの出現回数や一意のデータの数など,メタデータの統計を確認する。
 ・品質評価ツールMINTを使って,各フィールドの種別とその記述内容が合致しているかを確認する。
 ・EDMスキーマへのマッピングを確認する。
 ・識別子に重複があるレコードを確認し削除する。

 これらのプロセスにおいて,メタデータの確認はできるかぎり早く行われるべきとしており,Europeana aggregation teamがデータ提供機関と早い段階からコミュニケーションをとること,リンクや画像の解像度などの確認はアグリゲータが行なうことを提言している。

●低品質のメタデータが登録される要因

 登録されるメタデータの品質が低い要因として,メタデータ作成時に将来の利用が想定されてないこと,メタデータが資料保存プロセスの副産物であると考えられており,かつデジタル化された資料も十分に検証されてないこと,財源の制約があること,美術資料などデジタル化された資料の種類によってはメタデータが簡素であること,技術的な文書の理解が不足していること,などが挙げられている。

●タスクフォースの提言

 最後に,タスクフォースの提言が,3つの観点からまとめられている。まず動機づけの面で,コンテンツの精選,メタデータ処理プロセスの信頼性,Europeana Aggregation teamとデータ提供機関との十分なコミュニケーションが,次に技術面で,EDM関連文書の改訂やクロスウォークの追記,Linked open dataの語彙の使用,関連URIの記述が,最後に各機関の関係性の面で,メタデータ処理プロセスの透明性,データ作成機関やアグリゲータによるメタデータの確認が,それぞれ提言されている。

 タスクフォースは,この報告書はメタデータの作成に関する一般的なガイドとしても使えるだろうとしている。メタデータの内容やマニュアルの整備など技術的な要件は言うまでもないが,とくにメタデータの処理に関わるすべての関係者間のコミュニケーションの重要性を,この報告書は示唆していないだろうか。

関西館図書館協力課・阿部健太郎

Ref:
http://pro.europeana.eu/files/Europeana_Professional/Publications/Metadata%20Quality%20Report.pdf
http://pro.europeana.eu/share-your-data/data-guidelines/edm-documentation
http://pro.europeana.eu/blogpost/introducing-europeanas-aggregation-team
CA1552