CA2051 – オンライン資料収集制度(eデポ)の10年のあゆみとこれから / 原 聡子

PDFファイル

カレントアウェアネス
No.358 2023年12月20日

 

CA2051

 

オンライン資料収集制度(eデポ)の10年のあゆみとこれから

関西館電子図書館課:原 聡子(はらさとこ)

 

1. はじめに

 国立国会図書館(NDL)では、ウェブサイトや電子書籍・電子雑誌といったインターネット上の電子情報の収集・保存にも取り組んでいる。そのうち、民間が発行した電子書籍・電子雑誌等を収集するオンライン資料収集制度(eデポ)(1)が、2023年7月に制度開始から10年の節目を迎えた。オンライン資料とは、インターネット等で出版・公開される電子情報で、図書又は逐次刊行物に相当するもの(電子書籍・電子雑誌等)を指す。当初は収集対象を無償かつ技術的制限手段(DRM)(2)のないものに限定していたが、2023年1月からは有償又はDRMのあるものにも拡大した(E2548参照)。

 本稿では、オンライン資料収集制度の10年の取組を振り返り、課題と今後について展望する。

 

2. オンライン資料収集制度の経緯と概要

2.1 ウェブサイトの収集

 NDLにおけるインターネット上の電子情報の収集は、ウェブサイトの収集から始まった。2010年4月から、国立国会図書館インターネット資料収集保存事業(WARP)(3)により、公的機関のウェブサイトを国立国会図書館法に基づき網羅的に収集している(E1046参照)ほか、民間のウェブサイトについても発信者から個別に許諾を得て選択的に収集している。WARPが収集するウェブサイトには、オンライン資料が多数含まれており、公的機関が発行するオンライン資料の収集・保存はWARPにより実現されている。他方、民間のウェブサイトはごく一部を収集するに留まっており、NDLの任務である文化財の蓄積及びその利用に資するためには、民間が発行するオンライン資料を収集・保存する新たな仕組みが必要とされた。

 

2.2 オンライン資料収集制度の概要

 2013年7月、改正国立国会図書館法が施行され、民間で発行されたオンライン資料の納入を出版者に対して義務付けるオンライン資料収集制度(4)が設けられた(E1464参照)。以下で制度の概要を紹介する。

 

2.2.1 収集対象となる資料

 インターネット等で出版・公開される電子情報のうち、特定のコード(ISBN、ISSN、DOI)が付与されたもの、又は特定のフォーマット(PDF、EPUB、DAISY)で流通しているものを収集対象としている。無償かつDRMなしの資料は2013年7月以降、有償又はDRMありの資料は2023年1月以降に発行されたものが納入義務の対象となる。ただし、それ以前に発行されたものも出版者からの任意提供により受け入れている。

 

2.2.2 収集対象外の資料

 ほかの仕組みにより資料の蓄積及び利用提供がなされる以下の場合は、収集対象から除外している。

  • 納本済みの紙媒体の図書・雑誌と同一版面である旨の申出があり、NDLが確認したもの
  • WARPにより収集したウェブサイトに含まれるもの
  • 長期利用目的でかつ消去されないもの(学術研究機関等のリポジトリに収録されている資料)(5)

 3点目について、営利企業で構成される組織が運営するリポジトリの収録資料についても、所定の要件を満たすことをNDLにて確認し、リポジトリ運営者と覚書の締結等をした場合には納入義務の対象から除外される。現在、一般社団法人デジタル出版者連盟(電書連)(6)による電子書籍データの保存事業である「電書連・機関リポジトリ」の収録資料がこれにより除外されている。

 

2.2.3 収集方法

 収集方法は、オンライン資料を公開しているウェブサイトからNDLがファイルを収集する「自動収集」、納入者(出版者)がNDLのシステムにログインしてオンライン資料のファイルをアップロードする「送信」、そのいずれの方法でも収集ができない場合にDVD-Rに格納してNDLに郵送する「送付」の3種類がある。DRMありのものは、DRMのない状態にしたファイルを収集する。

 

2.2.4 利用提供

 収集したオンライン資料は、メタデータを付与した上で国立国会図書館デジタルコレクション(以下「デジコレ」;E2604参照)(7)で公開する。閲覧は原則としてNDLの施設内に限定しているが、権利者から許諾を得られた場合に限りインターネットで公開している。なお、WARPにより収集したウェブサイトに含まれるオンライン資料の一部は、WARPから抽出し、デジコレに登録している。

 資料の検索は、デジコレだけでなく、国立国会図書館オンライン(8)でも可能であり、さらに国立国会図書館サーチ(9)では、リポジトリ収録資料等の収集対象外資料との統合的な検索もできるようにしている。

 

3. 収集実績と課題

3.1 制度開始から収集対象拡大まで

 当初は納入が低調であったため、2013年から2016年にかけて、学協会や一部の民間企業がウェブサイトに掲載しているオンライン資料の洗出し及び納入の依頼を行い、学協会の機関誌や会報・通信、民間企業の事業報告書や株主通信、技報等を多く収集した。これらは定期的に刊行されているものが多く、現在に至るまで収集を継続している。2018年には、紙媒体からオンライン資料へ発行形態を移行した有償又はDRMありの学協会誌等について、出版者の任意提供による受入れを開始した。その後、有償又はDRMありの資料も納入義務の対象となった2023年1月からは、商業出版社が発行した多様な資料(専門書、実用書、ライトノベル、児童書等)も収集している。

 

3.2 収集実績(2023年9月末時点)

 オンライン資料収集制度及びWARPからの抽出により収集したオンライン資料の累積数は表のとおりである(10)。NDLではメタデータ(書誌)の数をオンライン資料の収集統計として採用しているが、記事・論文単位のファイルで流通している場合は記事単位でメタデータを作成しているなど、紙媒体とは作成の粒度が異なる。そこで、紙媒体の図書や雑誌の収集統計と比較できるよう、表ではオンライン資料が仮に紙媒体で発行されていた場合の「物理的な1冊の単位」に当たる点数も参考として記載した。有償資料については、2023年1月以降の収集数である。WARPからの抽出には、公的機関のオンライン資料も含む。

 

表 オンライン資料の収集数(2023年9月末時点)
オンライン資料収集制度 WARPからの抽出
うち有償資料
メタデータ件数 11万8,267件 752件 77万9,714件
うち記事単位 7万7,955件 8件 27万483件
【参考】物理点数 3万8,520点 728点 50万1,320点

出典:内部統計に基づき作成(11)

 

 なお、有償資料のうち納本済みの紙媒体の図書・雑誌と同一版面であるために納入義務対象から除外されたものは337点、電書連・機関リポジトリの収録資料のうち除外要件を満たしたものは1万2,429点ある。

 

3.3 課題

 以下では、課題を3点挙げ、それぞれについて今後の展望を述べる。

課題1 収集対象の判断やメタデータ作成ルールの改善

 オンライン資料には、流通の単位が冊・章・記事など一様でない、改版が多い等の特性がある。そのため、収集対象か否かの判断やメタデータ作成において、毎日のように前例のない事態に直面している。オンライン資料の特性を踏まえた合理的な運用ルールを構築していく必要があり、そのために日々の業務において対応を十分に検討し、事例とノウハウを蓄積している。

課題2 有償オンライン資料の発行数の把握と納入依頼

 2023年1月以降、NDLがオンライン資料収集制度で収集した有償オンライン資料と、納本済みの紙媒体との同一版面又はリポジトリ収録により納入義務の対象から除外した有償オンライン資料の総計は、約1万3,500点である。一方、2023年1月以降に発行された有償オンライン資料の総点数は、統計がなく把握が困難であるが、例えば国立国会図書館サーチで検索できる出版情報登録センター(JPRO)(12)の電子書籍の出版情報だけでも約2万6,000点あり、未収集となっているものが多くあると認識している(いずれも2023年9月末時点)。今後、出版情報との突合調査等により未収集資料の把握に努め、出版社等に対して納入依頼をすることを検討している。

課題3 他機関のリポジトリ等との連携の強化

 オンライン資料収集制度には、WARPや他機関のリポジトリ等との分担と連携によって網羅的な収集・保存を目指すという側面がある。そのため、漏れや重複を排しつつ合理的・効率的な収集・保存を実現していく必要がある。

また、本制度で収集対象外となった資料を統合検索により発見可能にすることも重要である。NDLでは2024年1月に国立国会図書館オンラインと国立国会図書館サーチの統合・リニューアルを予定しており、NDLでの利用に加え、他機関のリポジトリや電子書籍販売サイト等へのナビゲーション機能も強化する予定である。

 

4. おわりに

 オンライン資料収集制度は、2023年1月からの収集対象拡大により対象資料が大幅に増加・多様化しており、前章で挙げた課題への早急な対応が求められ、担当部署は日々奮闘している。今後も、制度の趣旨を御理解いただき、収集への御協力をお願いしたい。そして、オンライン資料を収集・保存して後世へ継承していくためのNDLの取組に注目していただきたい。

 

(1)オンライン資料収集制度(eデポ).
https://www.ndl.go.jp/jp/collect/online/index.html, (参照 2023-10-02).

(2)DRMとは、長期にわたる保存、保存のための複製、複数の端末での閲覧のうち、少なくとも一つが不可能であるような制御・制限を行う措置を指している。
納本制度審議会. 答申 オンライン資料の制度収集を行うに当たって補償すべき費用の内容について. 2021, p. 2-3.
https://www.ndl.go.jp/jp/collect/deposit/council/s_toushin_8.pdf, (参照 2023-10-02).

(3)国立国会図書館インターネット資料収集保存事業.
https://warp.da.ndl.go.jp/, (参照 2023-10-02).
なお、2010年以前も、2002年から「国立国会図書館インターネット資源選択的蓄積実験事業」、2006年から「国立国会図書館インターネット情報選択的蓄積事業」として、許諾に基づくウェブサイトの収集を行っていた。

(4)平田紀子. 国立国会図書館のオンライン資料収集制度について. 図書館雑誌. 2023, 117, p. 390-391.

(5)J-STAGEの収録資料及び学術機関リポジトリデータベース(IRDB)にデータ提供している各機関リポジトリの収録資料を収集対象から除外している。国立研究開発法人科学技術振興機構(JST)が運営するJ-STAGEの収録資料は、国立国会図書館法第25条の3に基づく収集対象外であることをJSTと文書で確認しており、そのためJ-STAGEへ資料を登録している各学協会等がオンライン資料収集制度の納入義務を負わない状態となっている。IRDBにデータ提供している各機関リポジトリの収録資料は、各機関の属性により、国立国会図書館法第25条の3又は第25条の4に基づく収集対象外である。
J-STAGE.
https://www.jstage.jst.go.jp/browse/-char/ja/, (参照 2023-10-02).
IRDB.
https://irdb.nii.ac.jp/, (参照 2023-10-02).

(6)一般社団法人デジタル出版者連盟.
http://ebpaj.jp/, (参照 2023-10-02).

(7)国立国会図書館デジタルコレクション.
https://dl.ndl.go.jp/, (参照 2023-10-02).

(8)国立国会図書館オンライン.
https://ndlonline.ndl.go.jp/#!/, (参照 2023-10-02).

(9)国立国会図書館サーチ.
https://iss.ndl.go.jp/, (参照 2023-10-02).

(10)デジコレの「電子書籍・電子雑誌」には、このほかに、国立情報学研究所の電子図書館事業(NII-ELS)の終了に伴いNII-ELSから2017年度~2018年度に移管を受けた学術論文等(約60万点)と、NDL刊行物(約1万点)も収録している。

(11)オンライン資料のメタデータは、上位から順に、タイトルレベル、巻号レベル、記事レベルという最大3階層で構成されている。本表における「うち記事単位」の件数は、記事レベルのメタデータ件数である。参考として示した「物理点数」は、単行書のように巻号レベルや記事レベルを持たずタイトルレベルのみで構成されるメタデータの件数と、雑誌のように同一タイトルの下に複数の巻号がひもづく場合の巻号レベルのメタデータ件数の合計である。

(12)一般社団法人日本出版インフラセンター(JPO)が運営する、出版社から提供された出版情報を書店・取次等に配信するシステム。2021年7月時点で、約2,000社の出版社が登録している。

[受理:2023-11-07]

 


原聡子. オンライン資料収集制度(eデポ)の10年のあゆみとこれから. カレントアウェアネス. 2023, (358), CA2051, p. 2-4.
https://current.ndl.go.jp/ca2051
DOI:
https://doi.org/10.11501/13123922


Hara Satoko
The Past 10 Years of E-legal Deposit of Online Publications and Its Future