E2699 – データ再利用性と論文アクセス性の向上に向けた奈文研の取組

カレントアウェアネス-E

No.480 2024.05.30

 

 E2699

データ再利用性と論文アクセス性の向上に向けた奈文研の取組

奈良文化財研究所・高田祐一(たかたゆういち)

 

●はじめに

  奈良文化財研究所(奈文研)では、2024年1月に「文化財データリポジトリ」を、また同年3月に「文化財オンラインライブラリー」を全国遺跡報告総覧(以下「遺跡総覧」)のウェブサイト内で公開した。本稿ではこれらのサービスについて紹介する。

●全国遺跡報告総覧について

  奈文研が運営する遺跡総覧は、日本全国の文化財に関する調査報告書類の情報を一元的に集め、提供するオンラインデータベースである(E1700CA1936参照)。研究者、学生、歴史に関心がある方々の貴重な情報源となっている。報告書類の書誌情報、調査成果を要約した抄録、全文PDFが含まれており、歴史と文化を理解するための有用なデータベースである。

●デジタル時代の調査報告のありかた

  遺跡総覧では、約3万9,000件の報告書類のPDFを搭載している。2024年5月時点でPDF494万ページ、33億文字のデータ量である。画像類は数百万はあると推計されている。遺跡総覧では、全文検索により必要とする報告書類を探すことが可能である。しかし、多数の報告書類が該当した場合、1件ずつPDFをダウンロードし、PDFを個別に確認していく必要がある。必要な画像や図面類があった場合、運が良ければPDFからデータとして取り出せる。そうでなければ、画面をスクリーンショットし、画像として入手することとなる。また報告書類には、論文に相当する有用な論考類(以下「論文」)が多数収録されているもののPDFとして他の調査報告類と一体化しており、データの点から分かちがたい状況である。文化財論文ナビ(CA2008参照)からタイトル等を検索できるものの論文本文へのアクセス性に課題がある。

  世界的にFAIR原則(E2052参照)が浸透しつつある。Findable(見つけられる)、Accessible(アクセスできる)、Interoperable(相互運用できる)、Reusable(再利用できる)の意味であり、オープンデータ公開の原則である。日本においても統合イノベーション戦略推進会議(第18回)において「学術論文等の即時オープンアクセスの実現に向けた基本方針」が決定し、オープンアクセス(OA)の機運が高まりつつある。

  しかし、遺跡総覧が主体とするコンテンツのPDFは、機械可読性が低く非構造化データであるうえ、PDF内の論文に直接アクセスすることができない。そこで、奈文研ではオープンデータとOAを一挙に実現するプラットフォームとして、文化財データリポジトリと文化財オンラインライブラリーを新規公開した。

●文化財データリポジトリ・文化財オンラインライブラリーの可能性

  文化財データリポジトリでは、調査や論文を単位とするデータセット(調査時の計測データ、写真や論文に掲載する図面、3次元データ等)を登録する。3次元データについては、従来はすべて2次元図面化していたが、本来3次元のまま扱った方が理解に容易なケースもある。3次元データをそのまま扱うことで、情報の欠落なく貴重な調査成果を新たな研究観点で再利用できる。各データは、個別に利用ライセンスが設定され、ダウンロードできるようになっており、ライセンスの範囲において再利用可能である。調査研究の効率化とデータ中心の研究を後押しできる。

  文化財オンラインライブラリーでは、論文を掲載できる。文化財データリポジトリに登録したデータセットを読み込むかたちで、論文にデータを利用できる。一度文化財データリポジトリにデータを登録すれば、別の論文でもデータを引用可能であり、当該データが重複して保存されることはなく繰り返し利用できる。さらにPDF形式ではなくWebページ化することで、検索エンジンから劇的にアクセスされやすくなる。またブラウザ上で多言語翻訳アプリも利用可能になることから、海外からもアクセスされやすくなることが見込まれる。

  近年、様々な事情で印刷を取りやめ電子公開になる刊行物が増えつつある。しかし多くはPDFを主体とした公開であるため、組版が必要であった。ウェブページにて公開することで組版作業は不要になる。また登録作業がウェブ画面で行われるため、組版等のDTPスキルがない人でも登録が可能になる。小規模な人文系学会では少子高齢化によって会員数が減少し、存続が危ぶまれている。会員減少による収入減少があり、学会の存続には財政的な問題が大きい。オンラインライブラリーによって論文誌発行のハードルが下がることは、学会の持続可能性を高め多様な学会活動を確保することにも繋がる。

●今後の展開

  文化財データリポジトリと文化財オンラインライブラリーはまだ実証段階であるため、奈文研による登録のみである。今後は、遺跡総覧に参加している機関にも両サービスを開放し、登録可能にする予定である。文化財データリポジトリでは、データごとにID管理するため、データ自体への引用を可視化できる。文化財オンラインライブラリーでは、論文ごとにIDを付与する。既に公開している文化財論文ナビも組み合わせることで、論文の引用・被引用を可視化できる。研究データおよびそれを活用した論文の活用状況を可視化できるようになることで、学術分野のトレンド把握や総括が可能となる。今後、データや研究成果の円滑な流通、活用状況の可視化に資する学術情報基盤として発展が見込まれる。

Ref:
“文化財データリポジトリの公開”. なぶんけんブログ. 2024-01-25.
https://www.nabunken.go.jp/nabunkenblog/2024/01/20240125-data-ripository.html
“文化財オンラインライブラリーの公開”. なぶんけんブログ. 2024-03-28.
https://www.nabunken.go.jp/nabunkenblog/2024/03/20240328-onlinelib.html
“文化財データリポジトリ”. 全国遺跡報告総覧.
https://sitereports.nabunken.go.jp/ja/search-cultural-data-repository/
“オンラインライブラリー検索”. 全国遺跡報告総覧.
https://sitereports.nabunken.go.jp/ja/search-online-library
“オンラインライブラリー一覧”. 全国遺跡報告総覧.
https://sitereports.nabunken.go.jp/ja/online-library
“文化財論文ナビ”. 全国遺跡報告総覧.
https://sitereports.nabunken.go.jp/ja/search-article
高田祐一. 「全国遺跡報告総覧」の機能と期待される効果. カレントアウェアネス-E. 2015, (287), E1700.
https://current.ndl.go.jp/e1700
八塚茂. FAIR原則と生命科学分野における取組状況. カレントアウェアネス-E. 2018, (353), E2052.
https://current.ndl.go.jp/e2052
高田祐一. 全国遺跡報告総覧における学術情報流通と活用の取り組み. カレントアウェアネス. 2018, (337), CA1936, p. 15-19.
https://doi.org/10.11501/11161999
持田誠, 高田祐一. 紀要論文等の書誌情報流通における課題と「文化財論文ナビ」の取組. カレントアウェアネス. 2021, (348), CA2008, p. 2-5.
https://doi.org/10.11501/11942241