3.3.2 電子書籍の保存の社会的意義

 PDF版はこちら

 図書館に収集されている資料は、ランガナタン(Shiyali R. Ranganathan)の「図書館学の五法則」のひとつ「図書は利用するためのものである」に示されるよう(1)に、利用されるために存在している。たとえ現時点において、利用者に利用されていない資料であっても、未来に重要な意味をもつことになる可能性がある。過去、歴史研究において、図書館の果たした役割はきわめて大きい。明治以後、書籍が図書館で収集・保存されていればこそ、今に生きる我々も、明治、大正時代の実相を知ることができる。そして我々、現在に生きる者には、現在の資料を未来に残す責務があるといえる。

 ところが今、図書館の紙の資料だけでは、時代の実相を知ることはできなくなっている。以前は印刷された情報さえ収集してあれば、その時代時代に発生し利用されていただろう情報がほぼ網羅できたが、現在では膨大な情報が紙の上にはない。すでにデータのみで紙に印刷されない形式の出版物であるCD-ROMが普及しはじめて20年が経過した。年鑑や統計集のような膨大なデータだけから構成される資料は、紙に印刷されることすらなくなりつつある。そしてインターネットの上を流れている情報についてはその全体像をつかむことはもはや不可能である。

 インターネットの情報については国立国会図書館のWARPプロジェクトが知られているが(2)、網羅的な収集にはいたっておらず、公的機関サイトなどの収集にとどまる。今後、順次その対象の拡大が図られるとしても、課題は多い(3)。まず、網羅的に収集すること自体が著作物の複製であり、現行法のまま収集するには著作権処理の問題が生ずる。著作権処理をサイト運営者に逐一確認の上、行うことは膨大な労力を必要とする。また収集対象と想定されるウェブサイトは、全てが日本国内のサーバ上に格納されているわけではない。さらに克服すべき技術的課題も多い。

 NDLはウェブサイト「電子情報の長期的な保存と利用」において、以下の理由を挙げて「電子情報」が脆弱であると述べている(4)

  • 紙媒体と比較して、記録媒体の寿命が著しく短い
  • インターネット情報は消失する可能性が高い
  • 電子情報を利用するためには、それに対応する特定の再生機器やPC・OS・アプリケーションプログラムが必要であるが、これらは絶えず進歩し、古いものは使えなくなることが多い。
  • 情報の改ざんが容易。
  • オリジナルであることを保証することが困難。

 

3.3.2.1 パッケージ系電子書籍の保存問題

 

 電子情報の長期的利用と利用の保障という課題を克服するために、NDLでは2002年度から電子情報の長期的な保存と利用保証のための調査研究に取り組んでいる(5)。その調査研究の一環として、2003~2004年度にかけて、CD-ROMやフロッピーディスクなど、パッケージ系電子出版物の利用可能性の調査が実施された(6)

 2003年度に実施されたパッケージ系電子出版物の利用可能性調査では、1990年度以前に受け入れた電子資料のうち、2003年度当時でも利用可能なものは3%にすぎなかった。1999年度受入分でも55%であった(7)。またアプリケーションソフトウェアが原因で利用できなかった電子出版物41件のうち6割以上にあたる26件が、電子書籍(ただし電子ブックやEPWINGフォーマットの電子辞書)ファイルで、6件はPDFファイルであった(8)。この結果から、電子出版物は特別な長期保存と長期アクセスのための対策を採らない限り、相当数のものが利用不可能になる、との分析を示している。引き続き2004年度に実施された調査では、プログラムやデータを同種の新たな媒体に移行させる「マイグレーション」、動作環境を他の環境上で擬似的に再現し、旧式環境用のソフトウェアを動作させる「エミュレーション」が実際に行われた。その結果、マイグレーション、エミュレーションともに、(当時は)実際的な対策ではないと結論づけたものの、再生環境が多種、多様で、媒体などの規格の移り変わりが激しい電子情報の長期保存には、マイグレーション、エミュレーションは不可欠であること、ファイル形式や再生環境に関するメタデータの付与が、必須であることが指摘されている(9)

 この点、紙の本は現在の技術的視点から見ると、媒体と再生機器が一致しているという優れた特質をもっていることになる。紙という媒体を劣化からさえ守れば再生機器がなくても、コンテンツについては永続的に読むことができる。紙の本は保存という側面に関してはきわめて優れた媒体といえよう。

 

3.3.2.2 電子ジャーナルの長期保存

 

 民間サーバーに蓄えられた電子データの滅失や接続不能という問題は、早くから電子化の進展していた学術電子ジャーナルの世界では、当初から指摘されていた。まず認識されたのは契約上の問題だった。電子ジャーナルは出版社とのサーバー閲覧契約期間が切れるとサーバーそのものへのアクセスができなくなり、結果として過去に講読した電子ジャーナルのバックナンバーまでも読めなくなる。これは一旦購入すれば、所蔵する限り利用可能な紙媒体の雑誌との根本的な違いである。

 これを解消するために出版社と顧客の間で結ばれたのが、永続的に電子ジャーナルにアクセスできる権利を契約にもりこむ“Perpetual Access”(10)である。個々の出版社はたとえ契約が切れた顧客であっても、契約期間に閲読可能であったジャーナルを制限はあるが永続的にも閲読可能とする。

 ただし、個々の出版社が自社のサーバーにあるデータへのPerpetual Access を保証したとしても、出版社が営利企業体である限り、倒産や事業中止といった事態にあっては、実際に「永続的」にアクセスを保証できるということはありえない。従って、字義通りPerpetual Access を保証するためには出版社とは独立した、なんらかの公的機関による保存システムが必要となる。この保存システムとして具体化した体制が、電子ジャーナルのアーカイビングである(11)

 公的機関による電子ジャーナルアーカイビングの動きはオランダ国立図書館(Koninklijke Bibliotheek:KB)の“e-depot”(12)が早い事例(2002年)として知られる。これは出版社がKBに無償で電子ジャーナルコンテンツを提供し、KBはそれを永続的に保管する。通常時には出版社の経営保護のため、読者への供給は行われないが、コンテンツ出版社が災害や倒産にみまわれた場合、e-depotに保存されたコンテンツが提供されるという仕組みとなっている。また単に保管するにとどまらず、記録内容と読み取りソフトとの両面にわたりマイグレーションの責任を持つとしている。

 後藤(13)によるとKBの例をはじめ、米国や英国などで電子ジャーナルを中心に公的な電子ジャーナルのアーカイビングが進められている。後藤が引用した“E-Journal Archiving Metes and Bounds”では、オランダ、米国、カナダ、ドイツ、オーストラリアの12の電子ジャーナルアーカイブが紹介されている。

 このうち“LOCKSS(Lots of Copies Keep Stuff safe)”(14)は、単純にデータを1カ所の図書館にアーカイビングするのではなく、複数箇所(主に図書館)に保存し、お互いに内容をピアツーピアで比較しあい精度を維持するという分散型の保存システムである。作業は図書館員ではなく、オープンソースソフトウェアであるLOCKSS(従ってこの名称自体はアーカイビングの名称ではなく、ソフトウェア集合の名称である)が自動的に行う。出版社が正常な機能を保持している、すなわち通常に営業している限りにおいては、LOCKSSに保存されたコンテンツは使用されず、出版社のコンテンツがそのまま利用者に提供される。だがいったん出版社が倒産や災害などにあった場合は、LOCKSSのネットワークからただちにコンテンツが読者に対して供給される。ここでもe-depotと同じく、出版社の商業性と公的な保存性を両立したシステムとなっている。また公的サーバーといえど、災害や革命・戦争に遭遇すれば、出版社のサーバーと同じく滅失の危険性は常にあるわけで、分散保持の意味は大きい。当然、この分散保持のネットワークは大きければ大きいほど安全であり、使用機関は全世界に拡がっている。

 2005年10月には、米国研究図書館協会(ARL)は声明「学術的電子ジャーナルの保存に必要な緊急行動(Urgent Action Needed to Preserve Scholarly Electronic Journals)」を発表し,電子ジャーナルアーカイブが提供すべきサービスや図書館が取るべき行動等に関する勧告を行っている(15)

 この勧告自体は簡単なものであったが、これを受けて,ARLと図書館情報資源振興財団(CLIR)の委託により行われたコーネル大学のレポートが、後藤の紹介したE-Journal Archiving Metes and Bounds(16)であり、詳細な調査にもとづく提言を行っている。この中の図書館に関する提言では、以下が述べられている。

  • 図書館や図書館コンソーシアムは、出版社にアーカイブに加盟し必要な権利義務を譲渡するよう求めるべきである。
  • 図書館は、電子ジャーナルのアーカイビングについて、情報を共有すべきである。
  • 学術機関は、すくなくともひとつのアーカイブに参加すべきである。
  • あらゆる規模の学術図書館は自らの希望に沿うよう、アーカイブに団結して主張するべきである。
  • 図書館は、アーカイブされた学術出版の記録簿(レジストリ)の開発に参加するべきである。

 図書館はアーカイビングを利用するだけなく、アーカイブのために積極的に活動すべきであると主張が行われているのがみて取れる。アーカイブはアーカイブの作成者が独善的にすすめるのではなく、関係者がお互いによりよいものを作るよう積極的に参加発言していくことが求められている。

 

3.3.2.3 ネットワーク系電子書籍の保存上の脆弱性

 

 物理媒体をもつパッケージ系電子書籍以上に、出版社のインターネットサーバーから供給される形式のネットワーク系電子書籍は、その永続的な保存と言うことでは問題が多い。媒体材質の劣化という問題からは一応免れてはいるものの、出版社が倒産や災害に見舞われた場合、サーバーごとコンテンツが逸失してしまう危険性からは免れえない。ネットワーク系電子書籍の場合、物理的な電子書籍が読者の手元なり図書館なりに供給され資料がローカルに存在するのではなく、情報の実際の保管場所は出版社のサーバーであり、必要に応じてそのサーバーから資料データを受信する形式をとる。この形式は個々の読者に物理的な実態を配布する必要がなく、紙の本を凌駕するさまざまな利点があるのは論を待たないが、いざサーバーそのものが倒産や災害に遭遇、滅失した場合、そこに蓄えられたコンテンツもサーバーごと失われ、一切読者のところにデータが供給されなくなってしまうというきわめて脆弱な性質を持っている。

 倒産や災害以前の問題として、経営的理由などでサーバーからの提供を出版社が中止してしまうだけでも、今まで読めていた資料が読めなくなる。サーバーからの情報提供は出版社の任意であり、事業中止もまた出版社の任意であるから、これを防ぐことはできない。最近では2008年から2009年にかけて、電子書籍端末「シグマブック」や「リブリエ(LIBRIe)」に対するコンテンツ提供が中止されたことは、記憶に新しい。くわえて、パッケージ系電子書籍と同様に、ソフトウェアやOSの変化という問題からも免れることはできない。

 これまでの図書館の収集対象であった紙媒体の「本」は、それを出版した会社が倒産に追い込まれても、天変地異による被害を受けたとしても、いったん発行された本は図書館に保存されている限り、失われることがなかった、しかも先述のとおり、紙は表示機器再生機器の機能を兼ねそなえており、長期に保存したとしても、物理的に紙やその上にのったインクが滅失しない限り、永続的に閲読が可能である。この紙の本の特質をまったく裏返した形で、ネットワーク系電子書籍はきわめて脆弱な基盤の上に成立しているといえよう。

 

3.3.2.4 電子書籍保存の技術的・社会的問題

 

 現在のところ、電子書籍保存に関して、電子ジャーナル保存ほどの危機感をもって語られてはいない。なぜなら、電子書籍はまだ、同じコンテンツの紙の本が別にあり、それをサーバー上でも読めるようにしたという段階にあるからである。保存という視点からすると、紙版と電子版の両建ての段階では紙をさえ従来形式で保存しておけば、少なくともコンテンツは保持できる。しかし、これは過渡的な現象であって、電子書籍についても、ケータイ小説で顕在化しているようにボーンデジタルで画面上でのみ読まれ、紙の本としては出版されないものも増えている現状を鑑みると、今後は電子ジャーナルと同じ危機感をもって保存を図らねばならないであろう。

 一方で電子書籍は技術的にみると、標準的なHTML、XMLファイルやPDFファイルでは記述されていないものが多いことに注意しておく必要がある。標準的なファイルであれば、かなりの年月そのエミュレーションソフト等が供給される可能性が大きく、そうした形式のままでも閲読が可能だろう。だが、現在の電子書籍はパッケージ系、ネットワーク系を問わず、さまざまな音声出力や検索など多彩な機能が付加されている。当然それらは個別のソフトウェアに依存し、OSに依存する。パッケージ系の電子書籍の項で述べたようにソフトウェア環境、OS環境は変化を続けるから、長期保存にあたっては外部環境の変化に耐えうる標準化が必要となる。つまり、電子書籍の保存にあたっては、単純に現在「ある」ものを保存するだけではなく、長期の保存を見据えた上での変換をほどこして保存せねばならない。

 まずは、特殊なファイル形式で発行された電子書籍を標準的なファイル形式に変換していくことが重要と思われる。その過程で、本来の電子書籍のもつ、音声や検索といった機能は失われるかもしれないが、コンテンツの保持を優先して次善の策に徹すべきだろう。ただ、どの機能を捨て、どの機能を活かすかの判断は機械的には難しく、実際の作業という点では解決すべき問題が多い。もちろん標準形式であったとしても超長期的には閲読不能となると考えられ、さらなる長期保存用の形式に変換することが重要性をもつ。現状では超長期保存に適したファイル形式といったものは存在していない。

 また出版社も、各社が独自にバラバラな規格で電子書籍を作るのではなく、長期保存やデータの共有ということを可能にする標準化フォーマットに沿った出版を意識する必要があろう。

 もちろん、このような考えを抱くのは、筆者だけではない。日本機械工業連合会とビジネス機械・情報システム産業協会は2005年3月、共同で『拡大する電子ペーパー市場と機械産業の取り組みについての動向調査研究報告書』(17)を刊行した。この報告書の射程は、「電子ペーパー」およびそれを用いた電子書籍端末であるが、電子書籍のファイル形式の標準化と互換性確立の必要性を指摘し、「ファイル形式を統一しなければ、電子書籍を未来にわたる共通財産とすることが困難である」と述べる。ファイル形式の標準化と互換性の確保は、現時点では「夢物語」の域を出ないものであるが、今後課題として検討を行う価値はあろう。

 

3.3.2.5 電子式年遷宮

 

 一方で、ソフトウェアやハードウェア環境の陳腐化とは別に、コンテンツそのものを格納する物理媒体の劣化という問題を見逃すことはできない。現在の電子媒体のデータ保持期間は20~30年と言われており、つまりはほぼ1世代ごとにデータを新たな媒体へと移し替える必要がある。今後、超長期保存にも耐えうる媒体が出現してくる可能性はあるが、どのような媒体であるにしても、完全で欠落のない保存が可能かどうかは、実際に時がたつまで保証できない。従って、かなりの期間、媒体変換を繰り返すことは必須であって、現状の技術での媒体変換だけでなく、その次の世代の媒体変換も見据えた保存体制が必要だろう。100年以内(媒体変換回数が3~4回程度)ならば、図書館の制度として媒体変換が保証できるかもしれないが、千年単位の保存と言うことになると、社会体制や図書館という組織の変化そのものが予想できず、制度だけでは無理がある。たとえば保存資料そのものにマイグレーションを要求するような機能、あるいはデータそのものが新たな居場所をもとめて自己複製によるマイグレーションを繰り返すような機能が必要なのではないか。もちろん、千年単位ではコンピュータの技術はどのような発展を遂げるか全く想像もつかず、マイグレーションも相当に様相のかわったものとなることが予想される。荒唐無稽なようにも思われるかもしれないが、千年という単位での保存を考えることは今までの図書館の役割を考えると当然に必要な行為である。

実は内容物の劣化を防ぐために、容器をあらたなものに移し替えるという行為は日本では長く行われてきた。神社の式年遷宮である。たとえば、伊勢神宮は20年ごとに本殿を建て替えるという行為を通じて、木材の劣化から神社そのものを守ってきた。それが持統天皇時代(690年)以来1,200年以上にわたって営々と営まれてきたことを考えると、デジタルデータの式年遷宮も条件さえ整えれば充分に可能ではないかと思われる。いずれにしても文化活動には千年単位の超長期的視点が必要と思われる。

 

(1) 邦訳は『図書館ハンドブック』第6版から引用した。
日本図書館協会図書館ハンドブック編集委員会編. 図書館ハンドブック. 第6版, 日本図書館協会, 2005, p.63.

(2) 国立国会図書館関西館事業部電子図書館課. インターネット情報の収集・保存に関する実験事業の終了と今後の取り組みについて. 国立国会図書館月報. 2006, (546), p.10-14.

(3) 廣瀬信己. Web情報のデジタル・アーカイビング:WARPを中心に. 情報管理. 2005, 47(11), p.721-732.

(4) “電子情報の長期的な保存と利用”. 国立国会図書館.
http://www.ndl.go.jp/jp/aboutus/preservation.html, (参照 2009-02-16).

(5) “電子情報の長期的な保存と利用”. 国立国会図書館.
http://www.ndl.go.jp/jp/aboutus/preservation_02.html, (参照 2009-02-16).

(6) 国立国会図書館. パッケージ系電子出版物の長期的な再生可能性について. 2006, 71p.
http://current.ndl.go.jp/files/report/no6/lis_rr_06.pdf, (参照 2009-02-16).

(7) 国立国会図書館. パッケージ系電子出版物の長期的な再生可能性について. 2006, p.8.
http://current.ndl.go.jp/files/report/no6/lis_rr_06.pdf, (参照 2009-02-16).

(8) 国立国会図書館. パッケージ系電子出版物の長期的な再生可能性について. 2006, p.13.
http://current.ndl.go.jp/files/report/no6/lis_rr_06.pdf, (参照 2009-02-16).

(9) 国立国会図書館. パッケージ系電子出版物の長期的な再生可能性について. 2006, p.57.
http://current.ndl.go.jp/files/report/no6/lis_rr_06.pdf, (参照 2009-02-16).

(10) OXFORD JOOURNALS. “Perpetual Access”. Oxford University Press.
http://www.oxfordjournalsorg/for_librarians/perpetual_access.html, (accessed 2009-01-10).

(11) 後藤敏行. 動向レビュー:電子ジャーナルのアーカイビング:海外の代表的事例から講読契約に与える影響まで. カレントアウェアネス. 2006, (288), p.15-18.
http://current.ndl.go.jp/ca1597, (参照 2009-01-10).

(12) “e-Depot and digital preservation”. Koninklijke Bibliotheek.
http://www.kb.nl/dnp/e-depot/e-depot-en.html, (accessed 2009-1-10).

(13) 後藤敏行. 電子ジャーナルのアーカイビングの現状:E-Journal Archiving Metes and Boundsを中心に. カレントアウェアネス, 2007, (294), p.16-19.
http;//current.ndl.go.jp/ca1645, (参照 2009-01-10).

(14) “What is LOCKSS Program”. LOCKSS.
http://www.lockss.org/lockss/Home, (accessed 2009-01-10)

(15) Waters, Donald J. “ARL Endorses Action to Preserve E-Journals” ARL Bimonthly Report, 2005, (243), p.18-19.
http://www.arl.org/bm~doc/arlbr243.pdf, (accessed 2009-02-18).

(16) Kenny, Anne R. et al. E-Journal Archiving Metes and Bounds: A Survey of the Landscape. Council on Library and Information Resources, 2006.
http://www.clir.org/pubs/reports/pub138/pub138.pdf, (accessed 2009-1-10).

(17) 平成16年度 拡大する電子ペーパー市場と機械産業の取り組みについての動向調査研究報告書. 日本機械工業連合会, ビジネス機械・情報システム産業協会, 2005, p.79-82.
http://www.jmf.or.jp/japanese/houkokusho/kensaku/pdf/2005/16sentan_04.pdf, (参照 2009-02-16).