E2460 – ダブリンコアとメタデータの応用に関する国際会議(DC-2021)

カレントアウェアネス-E

No.427 2021.12.23

 

 E2460

ダブリンコアとメタデータの応用に関する国際会議(DC-2021)

電子情報部電子情報流通課・町屋大地(まちやだいち),髙橋美知子(たかはしみちこ)

 

   2021年10月4日から15日まで,「ダブリンコアとメタデータの応用に関する国際会議(DCMI Virtual 2021)」(E2212ほか参照)がオンラインで開催された。国立国会図書館(NDL)からは筆者ら2人が参加した。

  今年の会議では,機械学習や外部データを活かした取組,多言語対応,デジタル資料や無形文化財のデータモデルについての発表が多く見られた。以下に,そのいくつかを紹介する。

●基調講演

  基調講演のひとつでは,フィンランドが2002年から段階的に進めてきたデジタル人文学のための国レベルの多分野Linked Open Data(LOD;CA1746参照)インフラの構築の歴史についてヘルシンキ大学のEero Hyvönen教授から発表された。集約されたオントロジー,アプリケーション,データ公開基盤等からなるLODインフラにより,セマンティックウェブが実現した一方,データソースによってデータの品質や意味が異なるため,利用においてはデータソースの評価とデータリテラシーが求められることが課題であると報告された。

●招待講演

   Europeanaにおける多言語対応に関し,対象の特性に応じて機械翻訳と人手による翻訳を使い分けて行う取組についてEuropeana Foundationから報告された。ユーザーインターフェースについては機械翻訳を使用する一方で,電子展示についてはボランティアによる翻訳を行っている。メタデータについては,書誌詳細の表示の際に機械翻訳を導入しているほか,検索時にキーワードを翻訳して検索する仕組みをスペイン語版において試行的に導入したとのことであった。翻訳検索は概ね有効に機能するとの結果が得られたものの,統制語の使用などの翻訳精度の改善が必要であることが示唆された。

●ベストプラクティスセッション

  韓国国立中央図書館(NLK)から機械学習を活用した件名付与の試行について発表があった。全国書誌作成時の件名付与の業務負荷を軽減するために,書籍の目次をオンライン書店から入手し,機械学習を活用して標目の候補を目録作成者に推薦する仕組みを試行したとのことであった。課題として,新規に採用された件名については十分な教師データが存在しないため適切な推薦がされないことが挙げられた。

  国立台湾師範大学からは,人物伝記情報データベースである台湾歴史人物伝記資料庫(TBDB)におけるメタデータスキーマの検討について報告があった。TBDBではデジタル人文学を支援するためにテキストマイニング,社会ネットワーク分析,地理情報システムの機能を備えており,CIDOC CRM(CA1434参照)とSchema.orgを参照して構築したメタデータスキーマでデータを構造化したとのことである。

  イスラエル国立図書館(NLI)からは,典拠管理のワークフローにWikidataとの連携を組み込んだ取組について報告があった。NLIでは典拠管理において多言語対応を行っており,そのためにWikidataが有益であるとの説明であった。NLIで新規に典拠を作成する際は,Wikidataとの対応関係を自館の図書館システムとWikidataの双方に登録するフローとしたとのことである。

●パネル「BIBFRAMEの実装」

   BIBFRAME(CA1837ほか参照)を導入している機関等から,プロジェクトやシステム構築の体制を中心に発表があった。

  米国議会図書館(LC)では,現状では目録作成者の一部がMARCでの入力に加え、BIBFRAMEでの入力を試行しており,100%のメンバーがBIBFRAMEのみでデータ作成に携わることを目指す「BIBFRAME 100」プロジェクトが進行中である。RDAとの整合性への対応,ローカルな名前空間の追加,統制語彙リスト等のツールの改善等を進めており,今後システムのクラウド化や編集機能の開発等のシステム面の対応,MARCとBIBFRAMEの相互データ変換の見直しも行う想定とのことである。

  米・スタンフォード大学からは,図書館リソースをリンクトデータ化する共同事業「LD4P」(Linked Data for Production)について報告があった。これまでクラウド環境とローカル環境をつなぐインフラ作成,BIBFRAMEオントロジーの独自拡張,コホートプラン(参加機関に助成金を提供し,クラウドベースの共同目録作成環境等を用いてデータ提供や調査報告を受ける事業)を実施し,現在は,目録作成・流通フローの整理を行っている。今後はOCLC,Share-VDE,Wikidata等とも連携を検討し,フローの持続可能性の向上を目指すとのことである。

  スウェーデン王立図書館からは,総合目録のBIBFRAME対応について報告があった。「Libris」はスウェーデン王立図書館が運営する500以上の図書館が参加する集中型総合目録で,国内の書誌情報と典拠情報を対象とする。BIBFRAMEに基づいた基盤システム「Libris XL」では,MARC21からRDFへのデータ変換機能と,MARC21への再変換機能も提供している。目録規則や慣習の変更により蓄積されたデータ不整合への対応と,異なる世界観を持つ各種リンクトデータ体系への対応が課題とのことである。

  発表した目録作成機関からは,MARC21とBIBFRAMEという2つの枠組みが同時に存在することへの対応が共通の課題として挙げられた。

  全体を通して、リンクトデータやオープンデータなどのアプローチを活用してデータをより豊かな形で整備・提供し、広く社会に貢献する仕組みを作るための取組が多く印象に残った。セッション内容や当日のスライド等は,一部を除いてウェブページから閲覧可能となる予定である。

Ref:
DCMI Virtual 2021.
https://www.dublincore.org/conferences/2021/
“DCMI Virtual 2021 : Programme”. Dublin Core Metadata Initiative.
https://www.dublincore.org/conferences/2021/programme/
Linked Data Finland.
https://www.ldf.fi/
Europeana.
https://www.europeana.eu/
Isaac, Antoine.; Moskalenko, Dasha.; Manguinhas, Hugo. “Three case studies on tackling Europeana’s multilingual challenges”. Europeana pro. 2021-02-08.
https://pro.europeana.eu/page/issue-17-multilinguality
臺灣歷史人物傳記資料庫.
http://tbdb.ntnu.edu.tw/
“Bibliographic Framework Initiative”. Library of Congress.
https://www.loc.gov/bibframe/
Linked Data for Production (LD4P).
https://wiki.lyrasis.org/pages/viewpage.action?pageId=74515029
ダブリンコアとメタデータの応用に関する国際会議(DC-2019). カレントアウェアネス-E. 2019, (382), E2212.
https://current.ndl.go.jp/e2212
石橋恵. 図書館データとWikipediaをつなぐVIAFbot. カレントアウェアネス-E. 2013, (251), E1517.
https://current.ndl.go.jp/e1517
武田英明. 動向レビュー:Linked Dataの動向. カレントアウェアネス. 2011, (308), CA1746, p. 8-11. 
https://doi.org/10.11501/3192158
菅野育子. 博物館情報の標準化−概念参照モデルの提案−. カレントアウェアネス. 2001, (267), CA1434, p.4-5.
https://current.ndl.go.jp/ca1434
柴田洋子. ウェブで広がる図書館のメタデータを目指して―RDAとBIBFRAME. カレントアウェアネス. 2014, (322), CA1837, p. 17-21.
https://doi.org/10.11501/8836977