カレントアウェアネス
No.274 2002.12.20
CA1481
動向レビュー
CrossRefをめぐる動向
1.はじめに
電子ジャーナルの歴史は1980年代にまで遡ることができるが,1990年代に入り,インターネットの爆発的な普及と電子出版技術の進展に伴い,電子ジャーナル刊行タイトル数は劇的な増加を見せている。Ulrich’sによれば,現在約27,000タイトル以上が刊行されている。また,米国研究図書館協会(Association of Research Libraries : ARL)のディレクトリによれば,査読付き電子ジャーナルの数は,2002年には5,451タイトルに達している。
こうした電子ジャーナルの普及とともに,複数の論文の引用関係をそのまま画面上でたどり,相互に参照されている論文間を行き来しながら論文の本文にまでアクセスできるような仕組みを求める利用者の声が高まってきた。そもそも学術論文とは,以前に発表された学術論文の成果をあるときは引用し,またあるときはそれに批判を加えながら,新たな学問的地平を切り開いて行くという研究活動の成果であり,ひとつの論文が独立して存在し得るものではない。それゆえ,こうした引用論文間のリンキング機能を求める声が上がるのも至極当然のことであろう。
出版社も引用論文リンキングの重要性を早くから認識しており,自社の電子ジャーナルに含まれる論文間のリンク付けについては早期に実現していた。しかし,電子ジャーナルを刊行する出版社がその数を増すにつれて,複数の出版社のジャーナルを横断するリンキング・システムに対する要求が新たに生まれてくることとなった。そしてこの期待に応えるために開発されたのがCrossRefである。本稿では,CrossRefをめぐる経緯と現状,その仕組み,今後の課題と展望について概観する。
2.経緯と現状
まず,CrossRefの誕生から今日に至るまでの経緯を年表風に追ってみよう。
1999年11月16日に,欧米の主要出版社12社が引用論文から全文へのリンキング・システムを開発することに同意。
同年12月9日,このシステムはCrossRefと名づけられる。
2000年6月5日,10出版社の2,700タイトルから130万件の論文メタデータを収集し,リンキング・サービスを開始した。
2002年5月,日本の科学技術振興事業団が提供する科学技術情報発信・流通総合システム(J-STAGE)がCrossRefに正式参加。
2002年10月現在,CrossRefに参加している出版社の数は150社以上に達し,6,400タイトル以上の電子ジャーナル,500万件を越える論文をカバーしている。
今のところ,CrossRefの対象資料は,雑誌論文に限られているが,将来的には,百科事典,教科書,会議録等のコンテンツも統合していく予定であるという。なお,CrossRefというのはあくまでサービス名称であり,その管理運営には非営利団体である出版社国際リンキング連盟(Publishers International Linking Association, Inc. : PILA)が当たっている。
CrossRefに参加するには,雑誌や論文の年間刊行数に応じた会費を払う必要がある。また,CrossRefのシステムに論文を登録し,CrossRefからDOIを検索する際にもその都度使用料がかかる。なお,利用者がCrossRefのリンキング・サービスを利用する際は無料である。
3.リンキングの仕組み
(1)DOI
CrossRefは,いわば電子論文間の交換機の役割を果たすサービスであるが,この機能を実現するためにデジタル・オブジェクト識別子(Digital Object Identifier:DOI)を援用している。
DOIとは,電子版ISBNのようなものであり,電子化されたオブジェクト(著作物)に付与される識別コードである。図書や雑誌の単位だけでなく,その中に含まれる章,論文,表など,どんな単位にでも付与できる。また,出版物に限らず,音楽・映像データにも適用できるとされている。
DOIシステムは,「オブジェクト識別子(DOI)」,「DOIからURLへの変換を行うディレクトリ・サーバ」,「オブジェクトが保存されている出版社等のサーバ」の3つの要素から構成されている。
DOIは管理機関が発行する出版社コードであるプレフィックスと,出版社がオブジェクトに付与する固有の識別コードであるサフィックスとから成る。例えば,D-Lib Magazineの2001年5月号に掲載された,Amy Brandの論文”CrossRef Turns One”のDOIは,”10.1045/may2001-brand”である。ここで10は管理機関コードで,国際DOI財団(International DOI Foundation : IDF)を示す。1045は出版社コード。ここまでがプレフィックスでIDFが付与するコードである。「/」以下の部分がサフィックスで,D-Lib Magazineが与えた固有の識別コードである。
ディレクトリ・サーバは,利用者の求めるオブジェクトのDOIを受け取り,それをオブジェクトの所在場所であるURLに変換して送り返す役割を果たす。DOIは恒久的に不変の識別子として登録されており,URLに変更があった場合には,出版社がこのサーバ上のURLを維持管理することになる。
利用者がオブジェクトそのものにたどり着く過程は,以下のようになっている。
- (i)DOIボタンをクリックすると,ディレクトリ・サーバにDOIが送出される。
- (ii)ディレクトリ・サーバはDOIを受け取り,それをURLに変換してブラウザに送り返す。
- (iii)ブラウザは,URLを認識し,それに基づき出版社等のサーバにアクセスする。
- (iv)出版社等のサーバからオブジェクトそのものが送られてくる。
(2)CrossRefによるリンキング
まず,CrossRefに参加した出版社は,DOIのプレフィックスの割り当てを受ける。電子ジャーナルに含まれる論文毎に,プレフィックスを含むユニークなDOIを創出し,論文の書誌的なメタデータと論文の所在場所を示すURLに結びつける。出版社は,DOI,メタデータ,URLがセットになったレコードをCrossRefのメタデータ・データベース(MDDB)に送る。CrossRef側は,論文毎のDOIとURLをDOIのディレクトリに登録する。
一方,引用文献へのリンク情報を設定しようとする出版社は,引用文献の書誌情報をMDDBの検索処理プログラムであるレファレンス・リゾルバーに送出する。レファレンス・リゾルバーはMDDBのデータベースを検索して該当文献のDOIを返す。こうして,出版社は電子ジャーナル刊行プロセスの一環として,CrossRefシステムに登録されている引用文献へのリンク情報を付加することが可能となるのである。
以上のような仕組みによって,利用者がある出版社の論文を閲覧し,その引用論文をクリックすると,その論文の出版元の如何にかかわらず,即座に当該論文をその場で閲覧することができる,というサービスが実現することになる。
4.課題と展望
(1)適切コピー(Appropriate Copy)の問題
今日の電子的な情報環境下では,同一論文の全文情報が複数の場所に存在するということが常識化している。例えば,出版社のサーバ,アグリゲータ(電子情報統合サービス提供業者)のサーバ,あるいは図書館のローカルサーバに,同一論文のコピーが複数存在する可能性がある。もちろん,図書館が所蔵する冊子体雑誌の論文もそのひとつである。ここから派生してくるのが,いわゆる「適切コピー」と呼ばれている問題であり,すなわち,ある特定の図書館の利用者を最も適切なコピーに導くにはどうしたらよいか,という課題である。
「適切コピー」の問題を解決するためには,各図書館が自らの利用者にとって最適なコピーへのリンクを設定する,つまりリンクのローカライゼーションが必要となる。CrossRefのリンキング・システムはDOIの仕組みを利用しているが,DOIとURLとの関係は基本的に1対1であるために,図書館が自由にリンク先を選択することは技術的に困難である。
この課題に対処するために,オープンリンキングの標準規格として注目されているOpenURL(CA1482参照)のフレームワークを援用することにより,利用者にとって最も有効なリンク先を図書館が設定できるような仕組みを取り入れようという試みも行われている。
(2)リンクの恒久的有効性
CrossRefのリンキング・システムの基盤となっているDOIは恒久的な識別子であり,将来にわたって変更されることはあり得ない。しかしながら,DOIに結びつけられたURLとその背後に存在する論文コンテンツそのものの維持管理に責任を負っているのは,あくまで出版社であり,出版社側の都合により,コンテンツの所在場所が移動する可能性がありうるのである。出版社がDOIとURLの対応付けの更新を怠れば,DOIの自動転送機構は直ちに機能不全に陥る。この問題への対応として,CrossRefはJSTORやAstrophysics Data System(ADS)といった電子ジャーナルのアーカイビング・サービスとのリンクを開始しているが,抜本的な解決策は電子ジャーナルの長期保存という,より高次の文脈のなかで模索されるべきであろう。
(3)全文検索サービス
CrossRefに参加する出版社が提出する論文書誌メタデータ,URL,およびDOIが蓄積されたメタデータ・データベース(MDDB)は,学術論文情報の宝庫である。CrossRefは,この情報をもとにした全文検索サービスを検討中である。MDDBに蓄積された論文のURLを起点にして,全文を自動収集し,それを索引化することにより全文検索サービスを提供しようという構想のようである。もし実現すれば,各参加出版社は,自身のウェブサイトに検索ボックスを設置し,利用者はそこから他の参加出版社が提供する全ての論文の全文を検索することが可能になるという。
こうしたサービスが現実のものとなれば,出版社は自社の電子ジャーナルに付加価値を加え,全文へのアクセス環境を向上させることができる。一方,利用者にとっても,単一のインターフェイスから複数の出版社が提供する電子ジャーナルを論文単位で統合検索できる環境が実現することになり,きわめて価値の高いサービスとなる可能性を秘めている。CrossRefは,既に出版社,図書館員,研究者,ベンダーを対象として市場調査を行っており,肯定的な反応を得ているとのことである。
しかしながら,このような全文検索が誕生した場合,既存の索引・抄録データベースの存在価値は著しく低下するおそれがある。CrossRefには,いくつかの大手の索引・抄録データベース供給業者も参加しており,このサービスが実現するかどうかは,こうした業者との利害関係をいかに調整できるかにかかっているのではないだろうか。
5.おわりに
CrossRefは,学術雑誌の引用文献のリンキングにとどまらず,今後さまざまな電子コンテンツ間のナビゲーションシステムの核となる可能性を秘めており,電子的情報資源へのアクセス環境の向上を標榜する図書館も,その動向については等閑視することができない。
ところが,現在CrossRefを運営するPILAには提携機関として,マサチューセッツ工科大学図書館や米ロスアラモス国立研究所研究図書館を含む約50の図書館が含まれているものの,理事の顔ぶれを眺めてみると,全て営利出版社あるいは学会系出版社の代表者で占められており,図書館関係者は1人も含まれていない。
CrossRefは,今後の学術情報流通システムにとって要となるサービスのひとつである。こうしたサービス,あるいはそこに蓄積された貴重なデータを一部の出版社の占有物にさせないためにも,CrossRefの動向については,常に図書館員による注視が必要であり,またその将来の方向性についても図書館サイドからの積極的な提言が求められているのである。
千葉大学附属図書館:尾城 孝一(おじろこういち)
Ref.
CrossRef. [http://www.crossref.org/] (last access 2002.10.14)
DOI. [http://www.doi.org/] (last access 2002.10.14)
鎌倉治子 DOI(デジタル・オブジェクト識別子) 国立国会図書館月報 (455) 32-35, 1999
時実象一 引用文献リンクプロジェクトCrossRef 情報管理 43(7) 615-624, 2000
Brand, Amy. CrossRef Turns One. D-Lib Magazine 7(5), 2001. [http://www.dlib.org/dlib/may01/brand/05brand.html] (last access 2002.10.14)
Walker, Jenny. CrossRef and SFX: complementary linking services for libraries. New LibrWorld 103(1174) 83-89, 2002
Hane, Paula. CrossRef Considering Full-Text Search Service. Information Today NewsBreaks & Conference Reports 2002.5.28. [http://www.infotoday.com/newsbreaks/nb020528-2.htm] (last access 2002.10.4)
尾城孝一. CrossRefをめぐる動向. カレントアウェアネス. 2002, (274), p.14-17.
http://current.ndl.go.jp/ca1481