E2612 – 日本古典籍を身近にする「国書データベース」

カレントアウェアネス-E

No.460 2023.07.13

 

 E2612

日本古典籍を身近にする「国書データベース」

国文学研究資料館・片岡真(かたおかしん)、飯沼邦恵(いいぬまくにえ)

 

  2023年3月1日、国文学研究資料館は「国書データベース」を公開した。国内外の機関や個人が所蔵する、江戸時代以前の日本の書籍(古典籍)を中心とした資料の書誌情報と全冊デジタル画像を無料で公開する総合データベースである。収録されているのは、約580の機関・個人が所蔵する資料の書誌80万件と、うち約200の機関・個人が所蔵する資料22万5,000点のデジタル画像であり、画像データの撮影枚数は2,400万枚である(2023年4月末日現在)。あらゆる分野の日本の古典籍を収録対象としている。

●概要

  1963年の刊行以来、古典籍を調査する研究者を中心に長く愛用されてきた『国書総目録』(岩波書店)は、国内で所蔵される日本の古典籍に関する大規模調査の成果として生み出された画期的な目録であった。当館はその事業を継承し、国内外に眠る古典籍の情報を調査・収集し、2006年から「日本古典籍総合目録データベース」として公開してきた。一方で、2014年から開始した文部科学省の大規模学術フロンティア促進事業「日本語の歴史的典籍の国際共同研究ネットワーク構築計画」(以下「歴史的典籍NW事業」)の基幹事業として、30万点の古典籍のデジタル画像の作成と公開を掲げ2017年から「新日本古典籍総合データベース」(E1992参照)を運用してきた。「国書データベース」は、双方の事業の結実として、両データベースを統合し運用を開始したもので、日本の古典籍に関しては世界最大のコンテンツ数を誇るデータベースである。

●特徴

  書誌情報は、当館で新たに作成したメタデータと所蔵機関からの提供データを統合・組織化し、一元的な検索を可能にしている。また、「国書データベース」では、古典籍の個別資料の書誌情報を、内容によって著作情報に紐づけしている。古典籍は、同じ作品(著作)であっても、その本により異なる書名をもつことがあり(たとえば、『源氏物語』、『光源氏』、『きりつほ』など)、逆に、同じ書名であっても、異なる内容をもつこともある(たとえば、紫式部の著した『源氏物語』とその注釈書が同じ『源氏物語』という書名である場合など)。そうした個別資料の情報を著作情報でとりまとめているため、同じ著作のバリエーションである個別資料を容易に比較できる。書誌、著作典拠、著者典拠のほか、画像の本文や絵につけられたタグからの検索も可能である。

  画像情報については、デジタル画像相互運用のための国際規格であるIIIF(CA1989参照)に対応したビューワMirador3を採用するとともに、画像表示の高速化も実現した。研究情報への永続的なアクセスを保証するため、画像を持つ書誌にはDOIを付与している。画像のオープン化を推進し、クリエイティブ・コモンズ・ライセンスを準用して多くの所蔵機関の各々の利用条件がロゴによって一目でわかるようにしている。また、海外からの日本情報へのアクセシビリティ確保のため、ローマ字よみや西暦を併記するなどの対応も行っている。

  システム面では、オープンソフトウェアPostgreSQLの拡張機能であるPGroongaの導入により、日本語検索の高速化を実現している。また、アプリケーションフレームワークとしてLaravel及びVue.jsを使用することで、従来のシステムに比べ、機能追加やインターフェースの変更の際の開発効率を大幅に高めている。

●意義と今後の展開

  「国書データベース」は、古典籍の書誌・所在情報の検索、画像の表示、画像の利用方法を案内するポータルとして機能している。大量の画像の公開や、他のデジタルアーカイブとの連携によって、研究者だけでなく「いつでも・どこでも・誰でも」古典籍を画像で楽しむことができ、古典をより身近に感じてもらえるようになった。

  当館では、蓄積してきた多様なデータのさらなる高次の利活用を推進し、分野を横断した研究の創出を目指すため、これまで事業や研究プロジェクト単位で作成された30を超えるデータベースの整理・統合を行い、2023年4月から新たなサービス体制に移行した。「国書データベース」は、この体制の中核となるデータベースとして、今後、歴史的典籍NW事業などによるコンテンツに加え、海外機関で所蔵される古典籍の目録「コーニツキー版 欧州所在日本古書総合目録」や、主に明治期以降近代を対象とした「近代書誌・近代画像データベース」との統合を行う。また、利便性の向上、新機能の追加なども続けていく予定である。くずし字を現代の文字に置き換えるテキスト化の推進(CA2015参照)や、データ利活用を促進するための書誌情報のAPI提供、国立国会図書館やオープンアクセスリポジトリ推進協会(JPCOAR)、これからの学術情報システム構築検討委員会などの関係諸機関との連携によるメタデータ標準化などを計画している。

  「国書データベース」は、国内外の所蔵機関などとの連携・協力により提供している。各所蔵機関の人々の、「自館の古典籍を保存・継承しつつ画像の公開によって利用を促進したい」「地域に根差して形成されたコレクションを地域の文化的特色として知ってもらいたい」といった情熱によって支えられている。彼らの仕事に深謝しつつ、今後も日本の古典籍を身近なものにし、新たな研究成果の創出に寄与するインフラとして発展させていきたいと考えている。

Ref:
国文学研究資料館. “国書データベース”稼働のお知らせ.
https://kokusho.nijl.ac.jp/page/kokushodbj-20230301.pdf
国書データベース.
https://kokusho.nijl.ac.jp
“国書総目録”. 国書データベース.
https://kokusho.nijl.ac.jp/page/kokusho.html
“日本語の歴史的典籍の国際共同研究ネットワーク構築計画”. 国文学研究資料館.
https://www.nijl.ac.jp/pages/cijproject/
“当館のデータベース(電子資料館)が変わりました” . 国文学研究資料館. 2023-04-03.
https://www.nijl.ac.jp/news/2023/04/post-290.html
“古典籍資料のOCRテキスト化実験”. NDL Lab.
https://lab.ndl.go.jp/data_set/r4ocr/r4_koten/
松原恵. 古典籍画像を見るなら,新日本古典籍総合データベース!.カレントアウェアネス-E. 2018, (341), E1992.
https://current.ndl.go.jp/e1992
永崎研宣. IIIFの概要と主要APIバージョン3.0の公開. カレントアウェアネス. 2020, (346), CA1989, p. 13-16.
https://doi.org/10.11501/11596735
橋本雄太. くずし字資料の解読を支援するデジタル技術. カレントアウェアネス. 2022, (351), CA2015, p. 10-13.
https://doi.org/10.11501/12199168