CA1860 – オープンなナレッジベースの進展とその背景 /上野友稔,香川朋子,古橋英枝,塩野真弓

PDFファイルはこちら

カレントアウェアネス
No.326 2015年12月20日

 

CA1860

 

 

オープンなナレッジベースの進展とその背景

電気通信大学学術情報課:上野友稔(うえの ともき)
お茶の水女子大学附属図書館:香川朋子(かがわ ともこ)
国立情報学研究所:古橋英枝(ふるはし はなえ)
京都大学附属図書館:塩野真弓(しおの まゆみ)

 

0.はじめに

 近年の学術情報流通においては、論文などの学術情報をインターネットを通じて誰でも閲覧できるようにするOpen Access、研究データなどを特別な制限無しに利用・再掲載できる形で公開するOpen Data、論文や研究データの公開を通して新たなイノベーションを創出することを目指す新たなサイエンスの進め方を指すOpen Scienceといった動きがある。

 加えて、研究成果を利用者にナビゲートするために図書館が作成するデータ、例えば電子ジャーナルのタイトルリストなどをオープンにし、図書館コミュニティで管理する動きが世界的に広まっている。

 本稿では、オープンな学術情報流通の国際的動向とその背景について、タイトルレベルの電子リソース流通の鍵となるナレッジベース(KnowledgeBase:KB)(CA1784参照)に焦点を当て、論じる。

 

1.KBとは

 米国情報標準化機構(NISO)(1)の定義によれば、KBとは「電子リソースに関するタイトルリストや収録範囲、リンク情報等、リンクリゾルバのベンダーが構築する豊かなデータベース」のこととされている。これに各機関において、特定のコンテンツに関する電子媒体でのアクセス可否や印刷媒体での所蔵の有無を反映したものは、特にローカルKBとして区別されている。

 KBはリンクリゾルバを支える一つのデータベースとして誕生した。1990年代後半にソンペル(Herbert Van de Sompel)によって構築された「Resolverモデル」は、従来、電子ジャーナルや電子書籍に代表される電子リソースについて、リンク元とリンク先が1対1 でしか提示できなかったのに対して、リンク元とリンク先の間に中間窓を設定することによって、1つのリンク元から複数のリンク先へとアクセスすることを可能にした(2)。この複数のリンク先情報を管理するデータベースとして「SFX base」が構築され(3)、のちの商用KB の原型となった。その後、このモデルを適用した商用のリンクリゾルバが次々に開発され、現在ではディスカバリサービスや、冊子体資料と電子リソースを共通に管理するLibrary Services Platform(CA1861参照)の中核としても活用されている。

 活用の場が広がる一方で、商用KB には次のような課題があることも明らかになった(4)

 第一に、商用KBベンダーがベンダーにとって都合のよいアクセス先のみ表示させたり、優先順位を高く設定させたりするリスクが存在しており、図書館側ではコントロールできない課題が生じていた。第二に商用KBベンダーが用意したKBに対して、各図書館が個別にメンテナンスを実行することで、同一データに関して複数機関で作業を行う、作業効率の低下が課題となっていた。

 これらの課題を解決するために始まったのがGlobal Open Knowledgebase(以下、「GOKb」とする。)(5)とKnowledge Base Plus(以下、「KB+」とする。)(6)に代表されるオープンなKBの構築プロジェクトである。KBをオープンにする理由は、コミュニティでKBを管理することにより、図書館がKBのデータをコントロールするイニシアチブを取り戻すとともに、作業効率の低下を解消するためである。

 

2.GOKbとKB+

2.1 GOKb

 GOKbは、Kuali OLEプロジェクト(7)E1003参照)と英国のJisc(8)がアンドリュー・メロン財団(9)から助成を受け、ノースカロライナ州立大学をリーダー機関として、2012年から構築されている電子リソースの、グローバルでオープンなKBである。GOKbは、サービス指向型アーキテクチャに基づく図書館システムを設計するプロジェクトKuali OLEで利用されることを目的としている。GOKb構築の目的は、Kuali OLEを設計するにあたって、電子リソース管理を支援するオープンでかつ図書館コミュニティによって管理されるKBがないという課題を解決することにあった。

 GOKbのデータは、電子リソースを保有する参加図書館から入手している。2015年9月現在、約2万4,000のタイトル情報、約300のタイトルの全部または一部をまとめて販売する形態であるパッケージの情報、18の利用者の範囲などの利用条件や契約条件の情報をもつテンプレートライセンスなどを含み、データはCC0で公開され、誰でもどのような目的でも利用できる。

 GOKbの基本精神がオープンかつ図書館コミュニティによる共同管理であることに伴い、KBの情報は電子リソースのメタデータ交換における標準規格であるKBART(10)形式で公開されている。また、データの再利用を促進するため、GOKb Linked Data Ontologyを策定して公開する予定である。同OntologyはGOKbが定義した独自の語彙に加え、BIBFRAME(11)、DataCite(12)、Dublin Core(13)等の汎用的な語彙を取り入れた複合的なメタデータスキーマ(14)で構成される。また、電子リソースのライセンス契約で定められた利用条件(ライセンス情報)は、電子商取引における標準化推進団体EDItEUR(15)が提供する標準規格ONIX for Publications Licenses(ONIX-PL)(16)形式で公開されている。これは、2013~2014年のONIX-PLEncoding Project(17)において作成されたもので、テンプレートの共有により、各図書館が電子情報資源管理システム(ERMS)に重複して登録していたライセンス情報の作成コストを削減し、かつ正確なライセンス情報をユーザに公開されやすくすることで契約資料の最大限の有効活用につながる効果をもたらしている。

 

2.2 KB+

 KB+は、Jiscと、HEFCE(英国高等教育助成会議)(18)から委任されたJisc Collections(19)により、2012年から英国で共同構築されているKBである。KB+は、英国内でKBを管理しつつ、英国の各大学・研究機関が持つローカルなデータを含めたデータベースである。KB+構築の目的は、英国の大学および高等教育機関向けに正確なKBを提供し、電子リソース情報の管理のために図書館員が費やしている労力と時間を最小化することにあった。

 KB+には、NESLi2(20)、Jisc eCollections(21)、SHEDL(22)等のコンソーシアム向けの協定に基づいたKBに加えて、GOKbと異なり、英国の各大学・研究機関の実際の契約に沿った情報、例えばローカルなライセンス情報、JUSP(23)の利用統計などのデータを併せ持っている。また、JiscはGOKbパートナーとなっているので、GOKbのデータがKB+に収録されていることに加え、ローカルな情報を含まないKB+をKBART形式によりCC0で公開している。Jiscは、2007年にライセンス情報の一部をONIX-PL形式にエンコーディングした(24)ことを皮切に商用のERMSへのONIX-PL形式でのデータ取り込みを開始する(25)等、英国コミュニティの枠を超え、ライセンスデータ共有のための基盤整備を国際的に牽引している(26)

 

3.広がりを見せるオープンなKBの連携

 この他にもこれまで世界的にさまざまなプロジェクトで、国またはコンソーシアムレベルのオープンなKBが構築されてきた。例としてカナダのサイモン・フレーザー大学図書館の逐次刊行物管理システムCUFTSのOpen Knowledgebase(27)、ドイツのZDB(Zeitschriftendatenbank)(28)、フランス高等教育書誌センター(ABES)のBACON(29)があげられる。これらはGOKbにデータを搭載する予定である。この他、スウェーデン国立図書館、中国の大学図書館コンソーシアムCALIS、後述する日本のERDB-JPも、GOKbにデータを提供することに関心を寄せている(30)。この他、世界規模の広義のKBとして、ISSN国際センターがユネスコの支援を受けて提供するサービスROAD(Directory of Open Access scholarly Resources)があげられる(31)

 GOKbのような包括的なKBを一つの図書館コミュニティで維持管理していくことは容易ではない。さまざまなコミュニティが作成する、収録対象やデータ内容が異なるKBと連携することで、国際的に作業の重複を避け、より正確で多様なデータを共有することを目指している。

 

4.ERDB-JPプロジェクト

 日本の大学図書館でも2000年代半ばから多くの機関で海外製商用KBの導入が進んできた。その中で、特に海外製商用KBに含まれる国内刊行の電子リソースのデータが少ないことが問題になっていた。このため、「大学図書館と国立情報学研究所との連携・協力推進会議」(32)を母体とする「これからの学術情報システム構築検討委員会」(33)の電子リソースデータ共有ワーキンググループが、国内の電子リソースに関する情報を集約・管理するデータベース“ERDB-JP”(Electronic Resources Database-JAPAN)(34)を構築し、2015年4月に公開した(E1678参照)。

 ERDB-JPのデータ形式はKBARTおよびKBART2にタイトルのヨミ、NACSIS-CAT書誌レコードIDなどの独自拡張フィールドを追加したものである。収録されたデータはCC0で公開しており、GOKbとの連携等、国内外へのデータ流通に向けた活動を予定している。

 ERDB-JPは、収録された国内刊行のOAジャーナルの情報をGOKbに提供することで、国際的な学術情報基盤整備と流通の潮流に、そのデータを載せる可能性を持つ。GOKbやKB+との国際連携が進めば、ERDB-JPデータを含むKBが、各種ディスカバリサービスやリンクリゾルバなどの様々なシステムを通して世界中の利用者から利用され、その結果として日本語の研究成果へのアクセス増加が期待できる。

 

5.オープンな学術情報流通の国際的な展望

 GOKb、KB+、ERDB-JPは、それぞれデータをCC0としており、それぞれのデータを、誰が、どのような目的でも、いかなる負担もなしに幅広く利用できることが期待されている。例えば、複数ある商用KBがこれらのデータを再利用し、より正確でリッチなKBが各種商用ツールをとおして流通することで、より多くの機関で利用されることも考えられる。実際にGOKbは、他国で構築が進むオープンなKBの収録を図りつつ、商用KBのベンダーと協議の場をもち、今後も多くの商用KBベンダーにGOKbデータを提供しようとしている。

 世界的なKBができつつある結果、図書館は商用ベンダーと協力しながら、KBの管理に主体的に関与し、KBのデータを正確で最新に保つ役割を担う。図書館がこの世界的なKBをディスカバリサービスなどで活用することで、利用者は電子リソースへの正確なアクセスを享受できる。立場や国を超えて図書館が必要とするデータを構築・管理する世界的なKBの取り組みは、今後、図書館が電子書籍など、より多種類の電子リソースのデータをさらに広く流通させるために、重要なモデルケースになりうる。

 

(1) “KBART: Knowledge Bases and Related Tools”. National Information Standards Organization.
http://www.niso.org/publications/rp/RP-2010-09.pdf, (accessed 2015-09-25).

(2) 増田豊. 学術リンキング S・F・X とOpenURL:―S・F・XとOpenURL―. 情報管理. 2002, vol. 45, no. 9, p. 613-620.
http://doi.org/10.1241/johokanri.45.613, (accessed 2015-09-25).

(3) Herbert Van de Sompel, Patrick Hochstenbach. Reference Linking in a Hybrid Library Environment Part2: SFX, a Generic Linking Solution. D-Lib Magazine. 1999, vol. 5, no. 4,
http://www.dlib.org/dlib/april99/van_de_sompel/04van_de_sompel-pt2.html, (accessed 2015-09-25).

(4) James Culling. “Link Resolvers and the Serials Supply Chain”.
http://www.uksg.org/sites/uksg.org/files/uksg_link_resolvers_final_report.pdf, (accessed 2015-09-25).

(5) Global Open Knowledgebase.
http://gokb.org/, (accessed 2015-09-30).

(6) Knowledge Base Plus.
https://www.kbplus.ac.uk/kbplus/, (accessed 2015-09-30).

(7) Kuali Open Library Environment.
https://www.kuali.org/ole, (accessed 2015-09-16).

(8) The Joint Informatin Systems Committee.
https://www.jisc.ac.uk/, (accessed 2015-09-16).

(9) The Andrew W. Mellon Foundation.
https://mellon.org/, (accessed 2015-09-16).

(10) “Knowledge Base And Related Tools (KBART)”. National Information Standards Organization.
http://www.niso.org/workrooms/kbart, (accessed 2015-09-16).

(11) “BIBFRAME.ORG”. Bibliographic Framework Initiative.
http://bibframe.org/, (accessed 2015-09-16).

(12) DataCite.
https://www.datacite.org/, (accessed 2015-09-16).

(13) “DCMI Metadata Terms”. Dublin Core Metadata Initiative.
http://dublincore.org/documents/dcmi-terms/, (accessed 2015-09-16).

(14) その他、“Bibliographic Ontology”,“FOAF”,“MODS RDF Ontology” , “RDF Schema” , “The Service Ontology” , “SKOS Simple Knowledge Organization System Namespace” , “STAC (Security Toolbox: Attack & Countermeasure) ontology”が採用されている。

(15) EDItEUR.
http://www.editeur.org/, (accessed 2015-09-16).

(16) “ONIX-PL”. EDItEUR.
http://www.editeur.org/21/ONIX-PL/, (accessed 2015-09-16).

(17) “ONIX-PL Encoding Project”. National Information Standards Organization.
http://www.niso.org/workrooms/onixpl-encoding/, (accessed 2015-09-16).

(18) Higher Educastion Founding Council for England.
http://www.hefce.ac.uk/, (accessed 2015-09-16).

(19) Jisc Collections.
https://www.jisc-collections.ac.uk/, (accessed 2015-09-16).

(20) NESLi2.
https://www.jisc-collections.ac.uk/journals/, (accessed 2015-09-16).

(21) Jisc eCollections.
http://www.jisc-collections.ac.uk/Catalogue/Overview/index/1819, (accessed 2015-09-16).

(22) SHEDL.
http://scurl.ac.uk/what-we-do/procurement/shedl/, (accessed 2015-09-16).

(23) 出版・アグリゲーターのジャーナルの利用実績データを、一元的に閲覧する英国のポータルサイト。
Journal Usage Statistics Portal.
http://jusp.mimas.ac.uk/, (accessed 2015-09-16).

(24) Brian Green, Liam Earney. The importance of linking electronic resources and their licence terms: a project to implement ONIX for Licensing Terms for UK academic institutions. Serials. 2007, 20(3), p. 235-239.
http://serials.uksg.org/articles/abstract/10.1629/20235/, (accessed 2015-09-16).

(25) “JISC Collections licence information to be included in Serials Solutions 360 Resource Manager”. Jisc Collections.
http://www.jisc-collections.ac.uk/News/JISC-Collectionslicences-in-360-Resource-Manager/, (accessed 2015-09-16).

(26) ONIX-PLおよび編集ツールthe ONIX-PL Editor(OPLE)は、JiscとPublishers Licensing Society(PLS)の共同出資により構築された。Jiscは単独でもONIX-PL Encoding Projectに1万ドルを出資し、ウェビナーの実施やe-ラーニング資料の公開等、ONIX-PLの普及活動を行っている。

(27) “Open Knowledgebase: reSearcher”. Simon Fraser University Library.
http://www.lib.sfu.ca/about/initiatives/researcher/openknowledgebase, (accessed 2015-09-18).

(28) Zeitschriftendatenbank.
http://www.zeitschriftendatenbank.de, (accessed 2015-09-18).

(29) BACON.
https://bacon.abes.fr, (accessed 2015-09-18).

(30) Kristen Antelman, Liam Earney, and Kristen Wilson. “GOKb: The Global Open Knowledgebase”.
http://www.slideshare.net/gokb/gokb-the-global-open-knowledgebase, (accessed 2015-09-18).

(31) ROADはISSNを有するオープンアクセスの学術資料を対象に、書誌情報の他、主要データベースへの採録状況、ジャーナル評価指標などをCC BY-NC 4.0で公開している。ISSN日本センターも2015年3月からROADへの登録を行っている。
ROAD.
http://road.issn.org, (accessed 2015-09-18).

(32) 大学図書館と国立情報学研究所との連携・協力推進会議.
http://www.nii.ac.jp/content/cpc/, (参照2015-10-30).

(33) これからの学術情報システム構築検討委員会.
http://www.nii.ac.jp/content/korekara/, (参照 2015-10-30).

(34) ERDB-JPは日本語が主な使用言語となっている、または編集・発行の責任主体が日本にある電子リソース(有料のものを含む)のタイトル情報を収録している。
ERDB-JP.
https://erdb-jp.nii.ac.jp/, (参照2015-09-18).

 

[受理:2015-11-16]

 


上野友稔,香川朋子,古橋英枝,塩野真弓. オープンなナレッジベースの進展とその背景. カレントアウェアネス. 2015, (326), CA1860, p. 6-8.
http://current.ndl.go.jp/ca1860
DOI:
http://doi.org/10.11501/9589932

Ueno Tomoki,Kagawa Tomoko,Furuhashi Hanae,Shiono Mayumi.
Progress and background of open knowledgebase.