CA1747 - 動向レビュー:ONIX:書籍流通における出版社のメタデータ標準化 / 吉野知義

PDFファイルはこちら

カレントアウェアネス
No.308 2011年6月20日

 

CA1747

動向レビュー

 

ONIX:書籍流通における出版社のメタデータ標準化

 

1. はじめに

 書籍をはじめとする図書館資料は、著者による執筆を起点に、利用者がそれを閲覧するまでの一連で流通され、次々に提供される。その中には、出版社、書籍取次、書店、図書館のそれぞれの役割が存在している。各場面において、書籍を流通させ、管理し、探すためには、その書籍を表す何らかのデータ(メタデータ)が必要であることは言うまでもない。

 図書館では、書誌データの交換フォーマットであるMARC(機械可読目録)が図書館資料の管理および利用者による検索のためのメタデータとして利用されている。MARCは一定の標準規格となっているため、国際的にも多くの図書館で共通で活用することができるようになっている。

 一方、出版社、書籍取次、書店の側にもメタデータが必要であることに変わりはない。これまでは各国、各社での独自運用が多かったが、最近では後述するEDItEURが管理するONIXというフォーマットの採用が欧米の出版社を中心に進み標準となってきている。

 本稿では、書籍流通における商品情報としてのメタデータであるONIXを取り上げ、その概要と共に図書館と関係した動き、および日本での対応状況について解説する。

 

2. ONIXについて

2.1. EDItEUR

 ONIXは、出版物の流通における標準化を推進する団体であるEDItEUR(European Book Sector Electronic Data Interchange Group)により管理されている。EDItEURは、1991年に設立された英国ロンドンに本部を置く国際団体で、19か国から80以上の機関がメンバーとして参加している。日本からは、一般社団法人日本出版インフラセンター(JPO)、株式会社紀伊國屋書店、丸善株式会社の3機関がメンバーとなっている(2011年4月1日現在)。EDItEURでは、メタデータと各種の識別規格の管理、利用促進を行っており、ONIX以外にもEDI(電子データ交換による商取引)、RFID(ICタグ)等の標準化、ガイドラインの作成、普及を推進している(1)

 

2.2. ONIXファミリー

 ONIXはONline Information eXchangeの略称であり、EDItEURが管理する規格の総称である。それらのONIXフォーマットの集合はONIXファミリーと呼ばれている。

 ONIXファミリーの全てのフォーマットは、XML形式で記述されている。XMLは書誌データのような複雑な構造を記述するのに最適であり、出版、流通、販売、ライセンス管理などの各種システム間で運用が容易であることや、データが人間でも判読できるため導入に障害が少ないことが利点である。また、出版社がONIXを採用する場合は無料でそのフォーマットを使用することができる。このように、必要な機能を確保しつつ、出版社が容易にONIXを採用できるようにしている。

 

2.3. ONIX for Books

 ONIX for Booksは、インターネット上での書籍販売において、より充実したメタデータの迅速な提供を求めるニーズに応えるため、米国出版社協会(Association of American Publishers:AAP)のデジタル化課題ワーキング部会(Digital Issues Working Party)の主導で開発が開始された。具体的な作業は、米国の書籍産業研究グループ(Book Industry Study Group:BISG)と英国の書籍産業コミュニケーション(Book Industry Communication:BIC)との密接な協力関係において進められている(2)。さらに現在では国際的な普及と実装のために、15か国の地域別ONIX委員会が組織され、それらの代表者が集まるONIX for Books国際運営委員会(ONIX for Books International Steering Committee)も構成されている。国際運営委員会は年2回開催され、ONIX for Booksの改訂や開発における方針、手順、優先度を決定したり、新しいバージョン内の相違点を解決し、リリースを認可したりするなどの任務を持ち、ONIX for Booksの統制を行っている(3)

 ONIX for Booksの最初のバージョンは2000年に1.0としてリリースされた。以降、継続的に改訂が行われ、2001年に2.0、2004年に2.1がリリースされ、書籍の商品情報を電子的に提供および通信する際の国際標準として位置づけられるようになった。そして2009年4月に3.0がリリースされている(4)

 最新の3.0の開発では機能的な追加だけでなく、項目間の関係性や配置の見直しを含む改訂が行われたため、3.0から2.1以前のバージョンへの下位互換性は保たれていない(5)。3.0における機能面の強化としては、近年の電子書籍の出版・流通の拡大への対応を中心に改訂が行われ、最新の流通形態に適応するような改善が施されている点である。現時点では2.1を採用している出版社が多いが、今後3.0への移行が進むものと考えられる。

 

2.4. MARCとの違いから見るONIX for Books

 冒頭に記したように、図書館では書籍のメタデータとしてMARCが利用されOPACを通して利用者へもその情報が提供されている。つまり、同じ書籍であっても、その情報がONIX for BooksとMARCの異なった規格で表現されることになる。ここでは、商品情報としてのONIX for Booksの特徴を理解するために、構造や特有の項目を中心にMARCとの違いを紹介する。

 まず、ONIX for Booksは商品としての書籍の流通をサポートすることを目的とし、MARCは一資料としての書誌事項のみを記述することを目的に定義されている。そのため、全体の構造、それぞれに含まれる項目要素、コード化される体系には差異があり、また書名、著者名のような基本的な書誌事項においても記述方式が異なっている。

 また、書誌データの集合としてのONIX for Booksは、発信出版社と受信利用者の情報を記述したMessage Headerと呼ばれる部分と、書誌情報と取引情報を記述したProduct Recordと呼ばれる部分との組み合わせで構成される(6)

 Message Headerには、発信出版社、受信利用者双方の識別子、名称、担当者名、メールアドレスなどが記述される。この部分はMARCには存在しない情報である。

 Product Recordでは、書名、著者名、出版事項、形態に関する事項などを中心に書誌事項が記述される。しかし、標目とアクセスポイントの概念は無く、複数の著者も並列に記述される。また、MARCでの記述は国際標準書誌記述(ISBD)で定義された区切り記号を伴うが、ONIX for Booksにはその必要はない。

 さらに、商取引を目的としているため、以下の項目はMARCには存在せず、ONIX for Books特有の情報であると言える(7)

  • Publisher:詳細な出版社情報、Webサイトなど。
  • Territorial rights / sales restrictions:販売対象市場、目的の限定など。
  • Supply detail:取次、販売店の詳細。価格、在庫状況、部数などの取引時の条件。

 さらに、3.0となって電子書籍へ対応することにより以下のような項目が加わっている。

  • Product form:大きさだけでなく、パッケージ形態、閲覧利用環境、媒体など。特に電子書籍に関する項目として、デジタル著作権管理(DRM)や印刷、コピーなどの利用許諾範囲なども記述される。
  • Cited content:他の書籍、論文などで引用されたリンク先の情報など。
  • Market publishing detail:マーケティング、キャンペーン情報。

 これらの項目は、同一の内容を持つ書籍が複数の利用環境や媒体で提供される電子書籍特有の情報や販売手法などを含むものである。そのため、書籍そのものの情報を集約し、その書籍の利用方法などは含まないMARCとは異なる部分となっている。

 

2.5. ONIX for Books以外のONIXフォーマット

 ONIX for Booksが最初に確立された後、EDItEURからはONIXファミリーとして雑誌情報、契約情報、識別子情報のフォーマットがリリースされている。ここではそれぞれの名称、最新バージョン、リリース時期のみを記す。

①ONIX for Serials:雑誌に関する情報(8)

  • ONIX-SPS(Serials Products and Subscriptions)
    雑誌商品情報(0.92-2008年6月)
  • ONIX-SOH(Serials Online Holding)
    電子商品購読情報(1.1-2007年6月)
  • ONIX-SRN(Serials Release Notification)
    近刊予定情報(0.92-2008年5月)

②ONIX for Licensing Terms:契約管理情報(9)

  • ONIX-PL(Publications Licenses)
    出版権(1.0-2008年11月)
  • ONIX for RROs(Reproduction Rights Organization)
    再版/再利用権
    -ONIX-DS –Distributions
     権利移動(1.0-2008年2月)
    -ONIX-RP –Repertoire
     既刊書籍の集積(1.0-2008年2月)

③ONIX for identifier registration:識別子登録情報

  • ONIX-DOI(1.1-2008年2月)(10)
  • ONIX-ISTC(1.0-2008年8月)(11)

 

3. 図書館との関係

 欧米では出版社を中心としてONIXへの対応が標準となりつつある状況で、図書館側でもONIXに関する様々な検討が開始されている。その中で世界最大の総合目録データベースを持ち、図書館関係のサービスを提供しているOCLCの活動を紹介する。

 

3.1. ONIX for Booksのメタデータに付加情報をつけて出版社に再提供するサービス

 2009年10月に開始された“Metadata Services for Publishers”は、出版社から依頼されたONIX for Booksによる書誌データに対して、OCLCのWorldCatが搭載している数多くの書誌データから適合する情報を追加し、出版社に戻すものである。各所で行われているメタデータの作成、整備作業の重複を取り除き、経費の削減を目指すサービスである。結果として、出版社にとっては自社書籍データの品質・精度の向上、図書館にとっては発注前からの充実した書誌情報の確認などの利点が見込まれる(12)

 

3.2. ONIX for BooksからMARCへのマッピング

 OCLCでは、前述のサービスと関連してONIX for Books 2.1とMARC21とのデータ交換のためのマッピングを検討し、相互の変換(クロスウォーク)についての報告書を2010年4月に出している(13)

 このマッピングの目標は、書籍に関する基本的な情報を2つの規格の間で受け渡し、出版社や図書館でそれぞれに有用だと考える高品質なメタデータを作成してデータ作成や管理の効率化を進めることである。詳細な相互変換の仕様はExcelのシートにまとめられ、ONIX for Booksの項目とMARC21のタグ、サブフィールドとの対応が示されている(14)

 当然ながら、変換可能なデータはMARC21に含まれる書誌的記述データに限定される。その中でも、データを若干の変更で置き換えられる項目もあれば、構造的な順序を変更する必要なものもある。例えば、ISBNのような固有の識別子はそのままONIX for BooksからMARC21へ置き換えが可能であり、書名は大文字・小文字の記述規則を変更して置き換えが可能である。一方で、出版者と出版年はONIX for Booksでは同レベルの項目として別々に存在するが、MARC21ではタグ260の中にサブフィールドで併記されるので、構造的な順序を変更した上での置き換えが必要になってくる。それ以外にも、コード化されたデータは、コード体系自体の変換も必要になってくる。

 報告書では、2つのフォーマット間での記述項目におけるレベルの考え方の違いや目録規則に則った記述方式に特徴があるMARC21への対応についての課題も挙げられている。ONIX for Books 3.0への対応は今後としているが、図書館、出版界の双方からの精査と改良が必要としている。

図 ONIX for BooksとMARC21の対応例

図 ONIX for BooksとMARC21の対応例

出典:Mapping ONIX to MARC (15)

 

4. 日本での取り組み

 欧米の出版社を中心に開発された経緯から、日本での出版社等によるONIX採用の動きはようやく最近になって始まってきている。本稿では、2011年4月1日付けで正式稼働を開始した近刊情報センターを紹介する。

 

4.1. 近刊情報センターの活動

 2010年度に総務省、文部科学省、経済産業省が3省合同で設置した「デジタル・ネットワーク社会における出版物の利活用の推進に関する懇談会」の提言に基づき、総務省委託事業「次世代書誌情報の共通化に向けた環境整備」が進められた(16)。その一環として日本書籍出版協会を代表機関として日本出版インフラセンター、NTTコミュニケーションズ株式会社、株式会社数理計画が受託したプロジェクトが、近刊情報センターとして正式稼働した。

 登録した発信出版社(117出版社・5団体/2011年4月1日現在)からそれぞれ近刊の書誌データをONIX for Booksのフォーマットで提供を受け、近刊情報センター内で整備・統合処理を行い、それを受信利用者である書籍取次、書店など(24書店・6取次・6団体/2011年4月1日現在)にONIX for Booksフォーマットで提供するサービスを行っている。このサービスは、書籍の近刊情報流通の基盤を構築し、近刊情報を活用した商取引の発展を目指している(17)

 現時点では、海外の出版社でONIX for Books 2.1での実績が多いことから、2.1に準拠したデータとなっている。3.0への対応は、国内外の出版社の状況を見つつ、今後の検討課題と考えられている。なお、ONIXに対応していない発信出版社、受信利用者もあることから、それ以外の方法、フォーマットでのデータ提供もサポートしている。

 

5. おわりに

 電子書籍の出版が増加しているだけでなく、インターネット上での書籍販売や書店の店舗で商品情報が幅広く活用されるようになってきているため、あらゆる場面で精度の高いメタデータが最適なスピードをもって提供されることが必要となっている。購入した書籍を管理し提供してきた図書館にとっても、出版社を中心に行われている書籍のメタデータの作成や活用にも注目が必要であろう。また、インターネットの世界ではメタデータ同士をリンクしてその情報力を向上させる研究も進められている。ONIXやMARCなどメタデータの特性を知ることにより、図書館で利用する書籍のメタデータも豊かになっていくものと考えられ、その活用に期待したい。

丸善株式会社:吉野知義(よしのともよし)

 

(1) “About”. EDItEUR.
http://www.editeur.org/2/About/, (accessed 2011-04-07).

(2) “ONIX”. EDItEUR.
http://www.editeur.org/8/ONIX/, (accessed 2011-04-07).

(3) ONIX for Books International Steering Committee. “ONIX for Books International Steering Committee: Terms of Reference”. EDItEUR. 2009-10.
http://www.editeur.org/files/ONIX%20for%20books%20ISC/20100813%20ONIX%20for%20Books%20ISC%20ToRs%20final.pdf, (accessed 2011-04-07).

(4) “ONIX for Books”. EDItEUR.
http://www.editeur.org/11/Books/, (accessed 2011-04-07).

(5) “About Release 3.0”. EDItEUR.
http://www.editeur.org/12/Current-Release/, (accessed 2011-04-07).

(6) “ONIX for Books Product Information Format Specification: Release 3.0”. EDItEUR. 2009-04.
http://www.editeur.org/files/ONIX%203/ONIX_for_Books_Release3-0_docs+codes_Issue_13.zip, (accessed 2011-04-07).

(7) “ONIX for Books Product Information Format Data Element Summary: Release 3.0”. EDItEUR. 2009-04.
http://www.editeur.org/files/ONIX%203/ONIX_for_Books_Release3-0_docs+codes_Issue_13.zip, (accessed 2011-04-07).

(8) “Current Releases”. EDItEUR.
http://www.editeur.org/18/Current-Releases/, (accessed 2011-04-07).

(9) “Overview”. EDItEUR.
http://www.editeur.org/85/Overview/,(accessed 2011-04-07)

(10) “ONIX DOI Registration Formats”. EDItEUR.
http://www.editeur.org/97/ONIX-DOI-Registration-Formats/, (accessed 2011-04-07).

(11) “ONIX ISTC Registration Format”. EDItEUR.
http://www.editeur.org/106/ONIX-ISTC-Registration-Format/, (accessed 2011-04-07).

(12) “OCLC Metadata Services for Publishers”. OCLC.
http://publishers.oclc.org/en/metadata/, (accessed 2011-04-07).

(13) Godby, Carol Jean.“Mapping ONIX to MARC”. OCLC. 2010-04-09.
http://www.oclc.org/research/publications/library/2010/2010-14.pdf, (accessed 2011-04-07).
ガッドビー, キャロル・ジーン. “ONIX からMARC へのマッピング”. 国立情報学研究所.
http://www.nii.ac.jp/CAT-ILL/archive/pdf/ONIX_Books_Documentation_jaweb.pdf, (参照 2011-04-07).

(14) “ONIX-MARC Mapping (Crosswalk)”. OCLC. 2010-03-31.
http://www.oclc.org/research/publications/library/2010/2010-14a.xls, (accessed 2011-04-07).

(15) Godby, Carol Jean.“Mapping ONIX to MARC”. OCLC. 2010-04-09.
http://www.oclc.org/research/publications/library/2010/2010-14.pdf, (accessed 2011-04-07).
ガッドビー, キャロル・ジーン. “ONIX からMARC へのマッピング”. 国立情報学研究所.
http://www.nii.ac.jp/CAT-ILL/archive/pdf/ONIX_Books_Documentation_jaweb.pdf, (参照 2011-04-07).

(16) “新ICT利活用サービス創出支援事業”. 総務省.
http://www.soumu.go.jp/menu_seisaku/ictseisaku/ictriyou/shinict.html, (参照 2011-04-07).

(17) JPO近刊情報センター. http://www.kinkan.info/, (参照 2011-04-07).

 

Ref:

Linked Dataでつながるデータ. http://linkeddata.jp/, (参照 2011-04-07).

 


吉野知義. ONIX:書籍流通における出版社のメタデータ標準化. カレントアウェアネス. 2011, (308), CA1747, p. 11-15.
http://current.ndl.go.jp/ca1747