E1868 – ダブリンコアとメタデータの応用に関する国際会議(DC-2016)

カレントアウェアネス-E

No.316 2016.12.08

 

 E1868

ダブリンコアとメタデータの応用に関する国際会議(DC-2016)

 

 2016年10月13日から16日まで,デンマークのコペンハーゲンにおいて「2016年ダブリンコアとメタデータの応用に関する国際会議(DC-2016)」(E1621ほか参照)が開催された。全体で20か国から約100名,日本からは筆者を含め研究者や学生等5名が参加した。

 13日及び14日に行われた本会議では,基調講演,研究・プロジェクト報告,プレゼンテーション,特別セッション及びポスターセッションが行われ,続く2日間には,Linked Data(CA1746参照)のデータモデルの設計等に関するワークショップが開催された。

 開発から20年が経過したダブリンコアの,次の10年間の始まりと位置付けられた今回の会議では,「メタデータ・サミット」と称し,ダブリンコアのこれまで,そしてこれからの取組について,また,ダブリンコアを開発・管理するダブリンコア・メタデータ・イニシアチブ(DCMI)以外の機関におけるメタデータに関する取組について,焦点が当てられた。筆者も,メタデータの活用事例として国立国会図書館(NDL)が開発し各種システムで使用している「国立国会図書館ダブリンコアメタデータ記述(DC-NDL)」を取り上げたプレゼンテーションを行った。日本語資料のメタデータを記述する事例に聴衆は興味を示しており,アルファベット以外を扱うメタデータへの関心を感じた。本会議で行われた報告等では,Linked Dataに関する発表が多く見られた。以下,この点を中心に会議の内容を紹介する。

 基調講演では,Elsevier社テクノロジー部門のチーフ・アーキテクトであるアレン(Bradley P. Allen)氏が「セカンド・マシン・エイジにおけるメタデータの役割」(The Role of Metadata in the SECOND Machine Age)と題し,ブリニョルフソン(Erik Brynjolfsson)とマカフィー(Andrew McAfee)によって2014年に発表され話題となった書籍“The second machine age: work, progress, and prosperity in a time of brilliant technologies”を参照しつつ,これからのメタデータの役割を整理した。人間の肉体労働を機械が行うようになった産業革命後の「第1機械時代」を経て,現在世界が移行しつつある「セカンド・マシン・エイジ(第2機械時代)」には二つの特徴がある。一つは人間の知的労働をも担うことができる人工知能の出現,もう一つは多くの人々がデジタル・ネットワークを介して相互に繋がっていることである。そこでは,人工知能と人間が協働することで,更なる進歩の可能性が開ける,というのがこの書籍の趣旨である。

 アレン氏は,この時代に求められるのは文書ではなく,人間の読む時間を短縮するために何らかの答えを提供することで,そのためには,文書を構成する文字列ではなく,物事そのものを扱う知識管理にシフトする必要があると述べた。そしてその際に注目すべきなのが,機械(マシン)が理解できる形で,物事そのものの情報をデータとデータの関係性で表した「知識グラフ(注)」である。知識グラフは,マシン・リーディングによってデータから答えを導き出すことを可能にするため,セカンド・マシン・エイジにおいて人間と機械の間のコミュニケーション手段となる。この知識グラフを活用する基盤となるのが,ダブリンコアのようなメタデータ標準である,とアレン氏は説明し,メタデータ標準が,セカンド・マシン・エイジにおいてウェブ上の情報資源を人間と機械の双方が発見可能で理解可能なものにする役割を果たすようになる,と指摘した。

 また,プレゼンテーションでは,コーネル大学図書館,ハーバード大学図書館イノベーション研究所,スタンフォード大学図書館が共同で行っているLinked Data for Libraries(LD4L)プロジェクトにおける興味深い取組が紹介された。LD4Lでは,図書館資料を表現するために独自に作成したオントロジーと,BIBFRAME(E1386CA1837参照)との連携を進めているとのことである。貴重資料・地図資料・動画資料等の特定分野の資料をBIBFRAMEよりも詳細に記述するための,オントロジー拡張のプロジェクトについても報告がなされた。

 英国図書館(BL)及び富士通アイルランド社からの報告では,両者が共同で実施した,英国全国書誌のLinked Open Data(LOD)のアクセス解析プロジェクトが紹介された。誰が,どのように使っているのか知るために行ったアクセス解析の結果,米国からのリクエストが3分の1を占めることや,調査を行った約1年間でSPARQL(CA1598参照)によるリクエストが大きく増加していることが分かったとのことである。LODのアクセス解析を行う意義は,人的・技術的資源や予算をより効率的に配分できること,サービス投資の参考になるユーザの傾向を把握できること,より分かりやすいユーザ向けの利用方法が提供できることであると述べられた。

 今回の会議をとおして,メタデータを扱う上でLinked Dataの重要性はますます高まっていると実感した。また,海外ではオントロジーの連携やLODのアクセス解析等,具体的な取組が進んでいることも感じられた。

 来年度の会議は,2017年10月に米国バージニア州のクリスタルシティで開催される予定である。

電子情報部電子情報流通課・安松沙保

注:例えば知識グラフでは,「夏目漱石」というデータは,「1867年2月9日」というデータと,「生まれた日」という関係性で結ばれた形となっている。そして機械はこれらのデータの関係性が理解できるため,夏目漱石の生年月日が知りたい人間に,「夏目漱石」,「生まれた日」という文字列が含まれる文書ではなく,「1867年2月9日」という答えそのものを提供することができる。

Ref:
http://dcevents.dublincore.org/IntConf/dc-2016
http://dcevents.dublincore.org/IntConf/dc-2016/schedConf/presentations
http://www.ndl.go.jp/jp/aboutus/standards/meta.html
http://dcevents.dublincore.org/IntConf/dc-2016/paper/view/464/534
http://iss.ndl.go.jp/books/R100000002-I026595735-00
http://dcevents.dublincore.org/IntConf/dc-2016/paper/view/433/505
http://dcevents.dublincore.org/IntConf/dc-2016/paper/view/420/548
E1621
E1386

CA1746

CA1837

CA1598