CA1552 – 動向レビュー:MARCとメタデータのクロスウォーク / 佐藤康之

PDFファイルはこちら

カレントアウェアネス
No.283 2005.03.20

 

CA1552
動向レビュー

 

MARCとメタデータのクロスウォーク

 

1. はじめに

 今日の学術情報を取り巻く環境においては,ウェブや電子ジャーナルなどの電子資源の拡大に伴い,個々のコミュニティやそのニーズに対応する多くのメタデータが開発されている。これらのメタデータの拡大により図書館員の感じる不安の多くは,メタデータの一種であるMARCやその前提とされるAACR2といった伝統的な図書館のプラクティス(図書目録を基礎として築き上げてきた記述規則や典拠および主題などアクセスポイントの統制,レコードフォーマットの標準などに沿った実務慣習)が,メタデータとどのようにかかわり,どのような影響を受けるのかという点ではないだろうか(CA1506参照)。メタデータの出現によって図書館の目録は時代遅れであるといった主張がある一方で,図書館の伝統的なプラクティスが電子資源の利用や保存といった側面におけるメタデータ作成においても重要な位置を占めることも論じられている。渡邊はセマンティックウェブと図書館コミュニティの関係を紹介する記事の中で,アダムス(Katherine Adams)らの論考を紹介してセマンティックウェブにおける典拠管理の必要性や主題アクセスとオントロジとの関係性について言及している(CA1534参照)。典拠管理や分類・件名・シソーラスといった主題アクセス機能は図書館が情報の組織化を目的に築き上げてきたものであり,現在これらの機能はMARCというレコード形式によって表現されている。

 さらにエデン(Bradford Lee Eden)は「メタデータとライブラリアンシップ:MARCは生き残るだろうか?」という論説の中で,この新しい情報時代の中でMARCが確固たる位置を占め続けることができるのか?という課題を提起し,いくつかの論考をまとめている(1)。これらの論考において,MARCはメタデータに取って代わられるのではなく,図書館の伝統的なプラクティスを継承し,図書館以外のコミュニティが持つメタデータのニーズにも広く対応できるように,メタデータと融合しなければならないとされ,その方法のひとつとしてMARCとメタデータのクロスウォーク(Crosswalk)が取り上げられている。これらの論考における文脈でのクロスウォークは,MARCとメタデータ間において各々の項目が持つ意味(semantics)を継承しながら相互利用を可能とすることであり,項目間の意味照合(mapping)と記述変換(translation)の二つのプロセスによって実現される。カース(Martin Kurth)らは,意味照合はメタデータ担当者の仕事で記述変換は情報技術担当者の仕事であるとして相互の違いを説明している(2)。さらにMETSのようにXMLの特徴を活用してMARCの持つ意味をそのまま包含するようなクロスウォークの形態も登場している。

 今日においてMARCは単なる書誌記述のためのメタデータとしてだけではなく,書誌ユーティリティや数多くの図書館システム,Z39.50通信プロトコルなどを通じて書誌レコードの運用基盤,流通基盤として存在している。一方でメタデータは新しい技術として優れた特徴を有してはいるものの,図書館がMARCと同様に業務基盤として活用するには未成熟な部分も残している。この課題に対する対処としてMARCとメタデータ間のクロスウォークを実現することにより,MARCの運用基盤や流通基盤を活用しながらメタデータの有効性を享受するだけでなく,図書館以外のコミュニティとの間での相互利用も期待できるだろう。マッカラン(Sally H. McCallum)は,XMLメタデータの一つであるMODSを紹介する論考の中で次のように述べている。
「図書館コミュニティは存在するMARC21レコードと新しいXMLレコードの間の継続性と接続性を提供しなければならない。(中略)レコード構造の違い(ISO2709対XML)は重大ではない。既に制作されたレコードおよびレコード内容の意味の互換性が重要である。」(3)(筆者訳)

 本稿では,エデンの紹介する論考を中心にMARCとメタデータのクロスウォークに関連する動向を取り上げ,MARCの生き残り戦略とも言うべき活動を確認する。なお本稿で取り上げるMARCは米国議会図書館(LC)が維持管理するMARC21(4)を指すことを,あらかじめご承知おきいただきたい。

 

2. なぜXMLなのか?

 最初に,メタデータを記述する際に使用されるXMLの特徴をクロスウォークという観点で確認する。XMLとその関連仕様については宇陀らが紹介している(5)が,筆者は以下の2つの機能が重要と考えている。

  • (1) 記述の変換機能
  • (2) 記述構文(スキーマ)の継承機能

 XMLはXSLT(eXtensible Style sheet Language Translation)という記述変換機能を持っている。スタイルシートの仕組みはXMLの元となったSGMLでは組版変換などの印刷機器に対応した複雑なものであったが,XMLではHTMLなどの別のスキーマへの記述変換を目的として利用されている。XSLTスタイルシートは,それ自体がXMLで記述された記述変換プログラムのようなものであり,XSLTスタイルシートを使用することによりクロスウォークに必要な記述変換を容易に実現することができる。カースらは基本的なXSLTスタイルシートの雛型があれば図書館の目録担当者が必要な機能の追加を行うことは容易であるとしている。

 XMLでは,メタデータを記述する際に名前空間(Namespace)に対応したタグを用いることによって,特定のスキーマによる記述の中に,別のスキーマを使用した記述を含めることができる。これにより一つのスキーマによる記述の中に,必要に応じてパッケージ化された複数の異なるスキーマによるメタデータを記述することができるため,別のスキーマを継承する新たなスキーマの設計が容易となる。後述するMETSでは,この機能を利用して記述メタデータや管理メタデータとして別のメタデータを包含するように設計されており,カンディフ(Morgan V. Cundiff)はMETSの紹介記事の中でMARCに準拠するXMLメタデータとしてMODSを取り上げ,METSの記述メタデータとして包含する例を示している(6)

 MARCが様々なXMLベースのメタデータとのクロスウォークを実現するために,これらの機能が実現できるXMLに対応することは妥当な選択といえるだろう。

 

3. MARCXMLとMODS

 MARCXML(7)とMODS(8)は米国議会図書館ネットワーク開発・MARC標準局(Library of Congress Network Development and MARC Standard Office)が開発したXMLスキーマである。

 MARCXMLは,MARCとXMLとの相互交換の標準として開発され,MARCのレコード構造であるISO2709をXMLに置き換えることによりXMLで記述された完全なMARCレコードを表現することができる。キース(Corey Keith)は,MARCXMLはISO2709とXMLの境界に位置し,MARCXMLによってXML化されたMARCレコードはXSLTを活用することによって様々なXMLメタデータとの相互変換を可能にするMARCXMLバス(bus)として機能するとしている。また具体的なXMLスタイルシートの事例やソフトウェアツールを挙げ,XML化されたMARCレコードの操作の実際を紹介し,これらのツールがLCによってインターネット上のウェブサービスとして公開される可能性に言及している(9)

 MODSは,MARCXMLによってISO2709の境界を越えたMARCレコードを,図書館のプラクティスを継承しながら,さらに容易なメタデータとするために開発されたXMLスキーマである。MARCXMLではISO2709との完全な互換性を維持するためにMARCのタグやインディケータ,サブフィールドという内容識別指示子(content designators)をそのまま残していた。このためにXMLスキーマであるもののMARCの分かりにくさを解消するには至っていない。一方MODSではレコード形式としてのMARCとの互換性に決別してMARCで表現される意味の継承に配慮した「言葉に基づくタグ」を採用し,一般的なXMLスキーマとの類似性を考慮し設計されている。MODSの場合,MARCの目録規則であるAACR2を継承するだけでなくAACR2によらない記述も容認し,さらに柔軟な記述が可能なように配慮されている。ガンター(Rebecca S. Guenther)によれば,MODSは特定の目録規則の使用を前提とするものではなく,必要であればAACR2に基づくMARCレコードも選択できるMARC21のサブセットであるとしている。またMODSと記述メタデータとして一般的なDC(Dublin Core)とを比較し,MODSがDCよりも詳細な記述を可能にするとしている(10)。鹿島はこのDCとMODSとの比較に関してガンターの論考を紹介し,MODSの基本的な視点が図書館目録の原点にあることに言及している(11)。さらにガンターはMODSのガイドラインや応用事例について述べた論考で,DCのようなシンプルなメタデータとのクロスウォークのためにMODSの項目(element)を簡素化したMODS Liteの可能性について言及している。またLCが中心となって展開するウェブアーカイブプロジェクトであるMINERVAプロジェクトでのMODSによる記述メタデータ構築の事例を取り上げ,MODSで記述されたレコードをMARCへ変換しLCのオンライン・カタログへ搭載できるように準備していることを紹介している(12)

 筆者はおそらくMARCXMLで直接書誌レコードが記述されることはないと考えている。MARCXMLはキースの論考にあるようにMARCに対してXMLの有効性をもたらすものであり,既に作成されたMARCレコードのXML版と位置付けることができよう。これに対してMODSはMARCの持つ意味を継承した新しいXMLスキーマであり,ガンターはMODSを直接記述作業に使用できるように設計されていると述べている。MODSの重要なポイントはMARCの持つ意味を継承すること,すなわち従来のMARCによる書誌レコードとXMLメタデータを融合させることのできるXMLメタデータスキーマであることといえるだろう。

 MARCXMLとMODSにより図書館の伝統的なプラクティスとその表現であるMARCは,1960年代後半に開発されたISO2709の殻を破り,最新かつ多くのコミュニティが支持するXMLへの歩み寄りを開始したといえる。ガンターはXML構文への移行により,MARCは引き続き何百万という書誌レコードに対し複雑かつ多様な検索を可能にする基準として利用価値を維持し続けるとしている。

 

4. METSにおけるXML化されたMARCの継承

 電子図書館連合(Digital Library Federation:DLF)は,OAIS参照モデル(OAIS Reference Model;CA1489参照)(13)に準拠した電子資源保存(Digital Preservation)のためのXMLメタデータスキーマであるMETS(14)を開発した。

 METSはOAIS参照モデルに定義される情報パッケージ(Information Package)の中のデジタルコンテンツの実体であるデジタルデータ(bit stream)を除くメタデータ部分の表現形式を意識して開発されている。METSは,記述メタデータ(Descriptive Metadata),管理メタデータ(Administrative Metadata),ファイルセクション(File Section),構造マップ(Structural Map),動作記述(Behavior)の各メタデータ部分で構成され,この中の記述メタデータ部分にXMLの名前空間機能によって別のメタデータを包含する構造を持っている。カンディフは,METSにおける記述メタデータの管理方法の一つはMETSで記述されたメタデータに既存の書誌レコードを埋め込むことだとし,METSにおける< xmlData >というタグは異なった名前空間のタグを接続する受け口(socket)のように機能するとしている。またMODSをMETSの拡張スキーマ(extension schema)として例示し,同様にMARCXMLやDCもMETSの記述メタデータの拡張スキーマとして利用できるとしている。METSを利用することにより,電子資源の保存の側面においてMARCで記述した書誌レコードをMODSに変換し再利用することも可能となる。また書誌レコードを包含したデジタルコンテンツの交換という側面でも活用が期待される。

 

5. メタデータ管理の視点

 MARCとメタデータのクロスウォークにより,メタデータを維持管理する側面でのMARCの活用も検討されている。

 カリーニ(Peter Carini)らは,マウント・ホールヨーク大学のアーカイブ(Mount Holyoke College Archives)での事例を紹介して,MARCからアーカイブコミュニティで一般的なメタデータスキーマであるEAD(Encoded Archival Description)への変換を報告している。この事例における変換プロセスでは,MARCレコードをMARCXMLレコードに変換しXSLTスタイルシートを使用してEADへ変換する方法を採用している。カリーニはEADからMARCへの変換よりもMARCからEADへの変換の方が,典拠の参照や件名付与といった作業がMARC上の通常の目録作業と共通化できる点で有利であり,より問題となることが少ないとしている(15)

 スミスらは,アイゼンハワー・ナショナル・クリアリングハウス(Eisenhower National Clearing-house)における教育カリキュラム資源のためのUSMARCの拡張を例に,MARCXMLとXSLTを使用したOAI-PMH(Open Archival Initiative Protocol for Metadata Harvesting;CA1513参照)やIEEE LOM(Learning Object Metadata)で使用されるメタデータへの対応を紹介している。MARCのタグを教育カリキュラム向けに独自に拡張し容易な変換手法を使用することによって,目録システムを通した資源管理のためのワークフローの最適化やデータ登録の合理化が実現できるとしている(16)

 コーネル大学図書館では過去に実施したメタデータを利用するデジタル化プロジェクトにおいて,図書館システム内のMARCレコードを電子テキストのメタデータとして使われるTEI(Text Encoding Initiative)ヘッダーやDCへ変換し,デジタル化プロジェクトの公開システムへ提供する方法が選択された。カースらはこれらのプロジェクトを通じて二つのシステム上でのメタデータ管理の重複が問題となり,メタデータ管理について確立された処理の流れをもつMARCベースの図書館システムに集中させたことを紹介している。この経験によってカースらは,デジタル化プロジェクトの記述メタデータとしてMARCの役割を見直す必要があることを提案し,この見直しを通して,図書館におけるMARCやその他のメタデータを対象としたメタデータ管理計画に検討内容を拡大する必要があることを指摘している。

 ここにあげた事例は,いずれもクロスウォークによりMARCから各種メタデータへの変換によるメタデータ管理を模索したものである。メタデータの維持管理にあたり,MARC上での目録規則に沿った記述作業や典拠および主題などの付与作業がメタデータに適切なアクセスポイントを与え,メタデータの運用基盤を補完することが示されている。

 

6. おわりに

 メタデータにおけるXMLの優位性は,その機能だけでなく多くのコミュニティに支持されている点においても明らかである。一方でMARCが表現してきた図書館の伝統的なプラクティスや書誌レコードの運用基盤が電子資源の時代においても引き続き重要となる。図書館コミュニティが図書館の伝統的なプラクティスをXMLで表現されるメタデータの世界へ移行させ,新しいメタデータ運用の基盤を作り出すことも可能かもしれない。しかし,これにはスキルの再構築や書誌ユーティリティを含めたレコード流通の再構築を含めて多くの課題があり現実的ではないように思える。テナント(Roy Tennant)は,21世紀の書誌的メタデータ基盤を展望する論考で以下のように述べている。
「データ移行が容易だという以外に特別の理由がないなら,他の多くのメタデータ標準を扱うにあたって同等の能力を持つ,MARC(MARCコードよりもむしろXMLでコード化されるだろうが)を処理できる基盤を創造しなければならない。言い換えれば,MARCをより広い,豊かな,多様な組み合わせのツールや標準,そしてプロトコルと同化させなければならないのである。」(17)(筆者訳)

 テナントは,この論考で新しい基盤で必要とされる要件や提案,課題などを挙げている。例えばMARCの拡張によるレコード形式の多様性に対応する際の問題や困難で慎重な対処が要求されるシステム移行,スタッフの再教育などの指摘については大変興味深い。一方で彼自身が述べているように新しい基盤の構築は長く困難な作業になることは間違いない。テナントが提案するような新しい基盤を展望しながら,現時点ではクロスウォークによる既存のMARCとメタデータの融合を目指すことが図書館コミュニティにとって現実的な選択肢かもしれない。

慶應義塾大学メディアセンター本部:佐藤 康之(さとう やすゆき)

 

(1) Eden, Bradford Lee. Metadata and librarianship: will MARC survive? Library Hi Tech. 22(1), 2004, 6-7.
(2) Kurth, Martin. et al. Repurposing MARC metadata: using digital project experience to develop a metadata management design. Library Hi Tech. 22(2), 2004, 153-165.
(3) McCallum, Sally H. An introduction to the Metadata Object Description Schema (MODS). Library Hi Tech. 22(1), 2004, 82-88.
(4) Library of Congress. MARC STANDARDS. (online), available from < http://www.loc.gov/marc/ >, (accessed 2005-01-18).
(5) 宇陀則彦ほか. “目録とメタデータに対するXMLの適用”. 図書館目録とメタデータ. 東京, 勉誠出版, 2004, 103-123.
(6) Cundiff, Morgan V. An introduction to the Metadata Encoding and Transmission Standard (METS). Library Hi Tech. 22(1), 2004, 52-64.
(7) Library of Congress. MARC 21 XML Schema. (online), available from < http://www.loc.gov/standards/marcxml/ >, (accessed 2005-01-18).
(8) Library of Congress. Metadata Object Description Schema (MODS). (online), available from < http://www.loc.gov/standards/mods/ >, (accessed 2005-01-18).
(9) Keith, Corey. Using XSLT to manipulate MARC metadata. Library Hi Tech. 22(2), 2004, 122-130.
(10) Guenther, Rebecca S. MODS: The Metadata Object Description Schema. Portal: Libraries and the Academy. 3(1), 2003, 137-150.
(11) 鹿島みづき. MODS: 図書館とメタデータに求める新たなる選択肢. 情報の科学と技術. 53(6), 2003, 307-318.
(12) Guenther, Rebecca. S. Using the Metadata Object Description Schema (MODS) for resource description: guidelines and applications. Library Hi Tech. 22(1), 2004, 89-98.
(13) 本稿ではOAIS参照モデルについて言及しないが,次に上げる論考に解説されている。
栗山正光. OAIS参照モデルと保存メタデータ. 情報の科学と技術. 54(9), 2004, 461-466.
杉本重雄ほか. ディジタルコンテンツのアーカイブとメタデータ. 人工知能学会誌. 18(3), 2003, 217-223.
国立国会図書館. 電子情報の長期的保存とアクセス手段の確保のための調査報告書. 2004, 153p. (オンライン), 入手先< http://www.ndl.go.jp/jp/aboutus/report_2004.pdf >, (参照2005-02-04).
(14) Library of Congress. Metadata Encoding and Transmission Standard (METS). (Online), available from < http://www.loc.gov/standards/mets/ >, (accessed 2005-01-18).
(15) Carini, Peter et al. The MARC standard and encoded archival description. Library Hi Tech. 22(1), 2004, 18-27.
(16) Smith, Janet Kahkonen et al. MARC to ENC MARC: bringing the collection forward. Library Hi Tech. 22(1), 2004, 28-39.
(17) Tennant, Roy. A bibliographic metadata infrastructure for the twenty-first century. Library Hi Tech. 22(2), 2004, 175-181.

 


佐藤康之. MARCとメタデータのクロスウォーク. カレントアウェアネス. 2005, (283), p.11-15.
http://current.ndl.go.jp/ca1552