E1312 – EPUBを長期保存フォーマットとして受け入れるための課題とは

カレントアウェアネス-E

No.218 2012.07.12

 

 E1312

EPUBを長期保存フォーマットとして受け入れるための課題とは

 

 オランダ王立図書館(KB)が,2012年6月18日付けで“EPUB for archival preservation”という報告書を公開した。

 KBは国立図書館としてオランダで発行された出版物を収集し恒久的に保存する役割を担っている。収集の対象は紙の史資料だけではなく,電子書籍などのデジタル情報資源も含まれる。今回公開された報告書の目的は,電子書籍フォーマットの1つであるEPUB形式の電子出版物の受け入れを望む出版社が増えている状況を受けて,EPUB(EPUB2/EPUB3)の長期保存用フォーマットとしての適性について分析することである。最後の第8章でKBが長期保存を想定してEPUBを現在の段階で受け入れる際の推奨事項を提示している。以下ではその内容を中心に紹介する。

 EPUBはHTMLやCSSのようなWeb標準技術などを用いたオープンスタンダードの電子書籍フォーマットで,電子出版業界の国際的組織であるInternational Digital Publishing Forum(IDPF)が仕様の策定・管理を行っている。縦書き表示など欧米言語以外のコンテンツに対するサポートが大幅に強化されたEPUB3(E1150参照)の仕様が2011年10月に確定している。

 同報告書では,まず,デジタル情報の長期保存の観点からEPUBが持つ強みとして,仕様が一般に公開されていること,仕様本体および仕様の中でコアメディアと規定されたファイルフォーマットに特許やライセンスの制約がないこと,XML,ZIP,XHTMLなど幅広く普及した標準的な技術をベースにしていることなどを挙げている。

 一方で,長期保存用フォーマットとしてEPUBを使用するリスクとして主に以下の点を指摘している。

  • 長期的な仕様の安定性への懸念
    EPUB2から3へのバージョンアップで仕様が大きく変更された。また, EPUB3は仕様の固まっていないHTML5やCSS3に大きく依存している。
  • EPUB3の閲覧環境
    (2012年5月時点に同報告書の執筆者が確認できる範囲で)EPUB3の仕様に正しく対応しているビューワーが存在していない。この問題はEPUB3の仕様が確定して日がまだ浅いことによるものであり,まもなく改善される見込みである。
  • コンテンツへのアクセスを長期的に担保する上でのリスク
    EPUB2/EPUB3ではデジタル著作権管理(DRM)や暗号化技術の使用が認められている。また,EPUB3では音声と動画に限り,EPUBファイルの外部にあるファイルへのアクセスが認められているため,EPUBそのものを保存しても,参照する外部ファイルが削除されてしまうとコンテンツの一部が欠落してしまう。
  • セキュリティ上の問題
    EPUB3でJavaScriptの使用が認められており,悪意のあるスクリプトがEPUBに埋め込まれる可能性がある。

以上のようなEPUBの特徴を踏まえた上で,長期保存を想定してEPUB形式の出版物を受け入れる際の8点の推奨事項を以下のように提示している。

  • EPUB3の閲覧環境が改善されるまではEPUB3形式の出版物は受け入れないこと。
  • デジタル著作権管理機能(DRM)や暗号化技術(埋め込みフォントの難読化を目的とするものを除く)が使用されているEPUB形式の出版物は受け入れないこと。
  • WMAなど,コアメディアタイプに規定されていないフォーマットのリソースを格納するEPUB形式の出版物は受け入れないこと。
  • 外部のファイルにアクセスするEPUB形式の出版物は受け入れないこと。
  • JavaScriptを使用したEPUB形式の出版物は慎重に取り扱うこと。
  • EPUB3ではコンテンツファイルとしてDTBook形式が使用されなくなったため,DTBook形式のコンテンツを含むものは避けること。
  • EPUBの仕様に従っているかどうか検証用ツール(Epubcheckなど)を使用して確認すること。
  • EPUB3の閲覧環境が改善されるまでは,科学技術書やコミックなどアドバンスドレイアウト(複雑なレイアウトを実現する技術)やタイポグラフィに大きく依存した出版物にEPUBを採用しないこと。

 KBの報告書が指摘するように,EPUB3の閲覧環境の問題は仕様が確定してからまだ日が浅いことに因るところが大きいため,時間の経過とともに解決していく可能性が高い。仕様の長期的な安定性の問題に対しては,関係者の間で行われている国際規格化に向けた議論の中でEPUB3をISOのTechnical Specification(技術仕様書)にする方向で話が進んでいる。しかし,同報告書で長期保存の観点から懸念されているDRMやEPUB3の新機能(JavaScriptの使用,外部ファイルへのリモートアクセスなど)を活用したコンテンツは電子書籍市場の拡大とともにむしろ増加していくものと考えられるため,電子書籍を長期的に保存する役割を担う機関が今後新たに直面する課題は少なくないと思われる。

(関西館電子図書館課・安藤一博)

Ref:
http://www.openplanetsfoundation.org/system/files/epubForArchivalPreservation18062012ExternalDistribution_0.pdf
http://www.kb.nl/dnp/deponeren-en.html
http://idpf.org/epub/30
http://www.itscj.ipsj.or.jp/sc34/open/1799.pdf
E1150