PDFファイルはこちら
カレントアウェアネス
No.316 2013年6月20日
CA1796
動向レビュー
次世代DAISY規格と電子書籍規格EPUB3
NPO法人 支援技術開発機構:濱田麻邑(はまだまゆ)
はじめに
読みたいときに読みたい本を、その場で検索して購入し、すぐに読める時代になっている。電子書籍に、読み上げツールですぐにアクセスできるとしたら、これまで読めなかった人々にとって、世界は変わる。
世界保健機関(WHO)の統計によると、視覚障害者は世界に2億8,500万人いる(1)。ディスレクシア等の学習障害者や、本を手で持ってページをめくることができない上肢障害者、小さな文字が見にくくなった高齢者等は、印刷物を読むことに困難を持つ「プリント・ディスアビリティ」と呼ばれる。また、インドのような多言語国家では、文書が母語でない言語で書かれていることが多く、教育機会が不十分な貧困層も多いため、文書に書かれた知識にアクセスできないことが多い。このように様々な人々から読み上げのニーズがある。
電子書籍で読み上げツールを活用するには、テキストデータにアクセスでき、それが論理的にマークアップされている必要がある。例えば、テキストの画像であれば、文字は見えるが、読み上げツールでは何も読み上げられない。また、たとえテキストを読めても、論理的なマークアップがなければ、読み手は何を読んでいるのか理解できない。
高齢で小さな文字が見えにくくなった場合や、小さな画面で読む場合は、文字を拡大する必要があるが、拡大して画面からはみ出すと読みにくい。拡大しても、文字が画面に収まるように自動的に改行(リフロー)される必要がある。
これらのアクセシビリティの機能に配慮した電子書籍のフォーマットが、DAISYやEPUB3である。
次世代DAISY
国際標準としてのDAISY規格は、1995年に国際図書館連盟(IFLA)の視覚障害者図書館サービス委員会(Libraries for the Blind Section;LBS)(2)の会議で、カセットに収録されたアナログの録音図書からデジタル録音図書に移行する際、各国で独自のものを開発するのではなく、国際交換を保障する共通規格を開発することが提案されて、開発が始まったものである。
DAISY規格の開発と維持を行っているDAISYコンソーシアム(3)は、1996年に国際非営利団体として世界6か国(日本、スウェーデン、イギリス、スイス、オランダ、スペイン)のLBSのメンバー図書館により設立され、事務局はスイスにある。DAISYコンソーシアムには、現在、正会員と準会員合わせて45か国の団体が加盟している。日本からは、日本DAISYコンソーシアムが正会員として参加している(4)。その他、議決権は持たないが、趣旨に賛同し協力するフレンド(賛助会員)には、Microsoft、Adobe、Google、Nuance等の国際企業が名を連ね、システム開発企業、出版社や個人もフレンドになっている。日本からは、シナノケンシ株式会社やOlympusが加盟している。
DAISYは、XHTML、SMIL等の(World Wide Web Consortium;W3C)の標準規格をベースにしたアクセシブルな電子出版のための規格である。DAISY図書は、国によって差異はあるものの、主に国立図書館の障害者サービス部門や学校の障害サービス部等で製作されてきた。これらの団体には、マルチメディアのDAISYだけでなく、音声、拡大、点字、電子テキストなど、利用者のニーズに応じて多様なフォーマットを提供するために、各団体で独自のマスターファイルを持っているところが多い(ワンソース・マルチユース)。
アクセシブルなフォーマットは、英国等の先進国では出版物の約5%、その他の国では1%未満である(2011年時点)(5)。特に、途上国では製作のリソースがなく、アクセシブルな出版物を入手できる確率が低いため、海外からの入手は重要である。マスターファイルを交換して、提供団体が利用者のニーズに応じた様々な形式で提供できれば、海外から各フォーマットを入手するよりも効率的である。これを実現するためには、マスターファイルを世界共通のフォーマットにすることと、国際交換を可能にする著作権制度および交換システム等の整備が必要である。
DAISYコンソーシアムは、DAISY3からDAISY4への改訂に際して、DAISY規格を製作・交換用のフォーマット(Authoring and Interchange Framework for Adaptive XML Publishing Specification;DAISY4-AI、2011年10月改訂)と配布用のフォーマット(2012年8月改訂)に分けることを考案した。これら2つを分けることによって、規格の開発と共に、製作と再生のそれぞれのツールの開発を効率的に行うことができるからである。
DAISY4-AIは、多様なフォーマットに変換するためのソースになるXMLファイルの規格である。ANSI/NISO Z39.98-2012(6)として、米国情報標準化機構(NISO)に登録されている。Z39.98-2012は、モジュール構造のため、基礎的な部分はシンプルで、必要に応じて様々なモジュールを追加できる。例えば、数式の入った図書を作る時は、後述するMathMLを追加すれば良い。ツールの開発においては、MathMLをサポートするかどうかを選択できるため、開発が容易になるという利点もある。
DAISY4の配布フォーマットは、DAISYのアクセシビリティの機能をすべてEPUB3に持たせるという形で、EPUB3に融合された。これは、一般的な利用者のためのメインストリームの規格でアクセシビリティを実現するという大きな意味がある。
著作権制度及び交換システム等の整備は、世界知的所有権機関(WIPO)の新著作権条約のアクセシビリティの活動により進められている。2010年、WIPOの著作権・著作隣接権常任委員会(Standing Committee on Copyright and Related Rights;SCCR)は、著作物へのプリント・ディスアビリティを抱える人々のアクセス権を保障するための新著作権条約の審議を行っており、2013年6月の外交会議で最終決定される予定である。それと並行して、WIPO事務総長の下に世界盲人連合(World Blind Union;WBU)、国際出版連合(International Publishers Association;IPA)、IFLA、DAISYコンソーシアム等によるステークホルダーズ・プラットフォームが構成され、TIGAR、Capacity Building WG、Enabling Technology WGという3つのサブグループが活動している。TIGAR(Trusted Intermediary Global Accessible Resources;信頼のおける媒介機関によるグローバル・アクセシブル・リソース)は、アクセシブルな電子書籍を交換するための国際電子図書館のパイロットプロジェクトで、Capacity Building WGは、TIとなる団体が存在しない、最貧国を含む開発途上国での拠点を作るための人材養成プロジェクトである。最後のEnabling Technology WGは、出版社と協力して、アクセシブルな出版を実現するための技術プロジェクトである。
EPUB3とDAISYとの関係
EPUBは国際電子出版フォーラム(International Digital Publishing Forum;IDPF)(7)により、メインストリームの出版社が使うために開発が始まった規格である。2011年10月に、HTML5等のW3Cの標準規格をベースとしたEPUB3が公表された。EPUB3は前バージョンとは大きく異なり、多言語対応とアクセシビリティの対応がなされた。特に多言語対応ワーキンググループ(Enhanced Global Language Support;EGLS)(8)においては、村田真氏がリーダーを務めたことで、ルビや縦書き等の日本語表現もサポートされたため、日本でもEPUB3の普及が加速した。
EPUB3では、DAISYのアクセシビリティの機能がすべて採用された。もともと、DAISYコンソーシアムはIDPFの創設メンバーであり、録音図書と点字図書を扱うメンバー団体が共同してEPUBがアクセシブルな規格となるよう積極的に開発に関わっていた。しかし、アクセシビリティに精通した規格開発のできる技術者が限られている中で、2つの規格を同時に別個に開発することは困難であった。また、DAISYコンソーシアムの目的はメインストリームの出版物のアクセシビリティの実現である。そのため、EPUBにDAISYのアクセシビリティの機能をすべて移植することを前提に、DAISYの次期規格であるDAISY4の配布フォーマットをEPUB3と定めることで、利用者から見ると次世代DAISYとEPUB3は完全に融合されることとなった。
EPUB3の主なアクセシビリティ機能
ここでは、EPUB3のアクセシビリティ機能の主なものをとりあげ、それにより何が実現できるのかを紹介する。
- 論理構造(セマンティック・マークアップ)
HTML5の論理構造を適切に活用すれば、ウェブアクセシビリティと同じように、見出しやページ等の論理構造をコンピュータが解釈して、音だけで効率的に図書を読むことができる。
- Media Overlays(メディア・オーバーレイ)
これまでのDAISY図書と同じように、音声とテキストを同期させて提示できる。テキストをハイライトさせながら、該当部分の音声を再生できる。DAISYコンソーシアムのオープンソース・ツールの一つであるTobi(9)等の製作ツールがある。
- TTS(音声合成エンジン)に対応した付加情報
TTSが、EPUB3図書を読み上げる際に誤読を減らすためのいくつかの付加情報がある。例えば、SSML(Speech Synthesis Markup Language)で、これは日本橋を「にほんばし」と読むか「にっぽんばし」と読むか等、対象となるテキストに特定の読み上げをさせるためのマークアップができる。また、PLS(Pronunciation Lexicon Specification)は、図書固有の読み上げ辞書を同梱できる機能で、CSS Speech Moduleは女性・男性等声の種類やポーズ長等、読み上げに関するスタイルを定義できるものである。
- 多言語対応
日本語のルビ、縦書きを表現できる。アラビア語等のテキストで、1行の中で右から書く部分と左から書く部分とを共存させることもできる。
- MathML(Mathematical Markup Language)
数式内の論理情報にアクセスできるので、数式内を要素ごとに移動しながら合成音声で読み上げたりできる。
- SVG(Scalable Vector Graphics)
画像内の論理情報にアクセスできるので、画像内のテキスト情報を合成音声で読み上げたりできる。拡大しても画質を一定にできる。
- ONIXのアクセシビリティに関するメタデータ
製作したEPUB3図書がアクセシビリティのどの項目をサポートしているかを、ONIXコードリスト196(10)を活用して書誌情報に入力できる。利用者は、ニーズにあった図書を検索することができる。
このように多様なアクセシビリティ機能がある一方で、EPUB3に準拠していてもアクセシブルでない電子出版物も製作できてしまうといった課題もある。例えば、文字が画像として処理されている文字データのない図書は、読み上げ機能ではアクセスできない。また、デジタル著作権管理(Digital Rights Management;DRM)によっては、音声読み上げができなくなったり、特定のデバイスでないと図書が開けなくなることもある。
現在、デファクト標準であるEPUB3を公的な標準化機関によって策定されるデジュール標準にする動きが進んでいる。これは、公的機関(特に教育)での調達を含む普及促進や、国立図書館等での長期保存等が目的である。また、EPUB3.01への改定作業が進行しており、2013年11月頃に最終テキストが完成する予定だ(11)。
関連プロジェクト
規格の実用のためにいくつものプロジェクトが実施されている。
図表のアクセシビリティのプロジェクトとしては、米国教育省の助成のもと、Benetech(12)、WGBH(NCAM)(13)、DAISYコンソーシアムで構成されたDIAGRAMプロジェクト(14)がある。
アクセシブルなEPUB3の再生環境のプロジェクトとしては、Readiumプロジェクトがある。Readium WebとReadium SDKが開発されている。EPUB3図書を既存のブラウザで再生するための拡張機能の開発も行われており、色、文字サイズの変更、音声の同期した図書の再生等アクセシビリティもサポートされている。
課題
2013年3月末現在、4月から生徒が使う教科書をDAISY化するための素材となるデジタルデータ(PDFおよびテキストデータ)はまだ一部しかDAISY教科書製作ボランティアに届いていない。他の先進国では、アクセシブルな教科書の提供は政府の責任で行われているのに比べ、日本では、これをボランティアが実質的に無償で行っている。新学期が始まって数か月経ってから製作を始めたのでは、プリント・ディスアビリティの生徒に届くのはいつになるのか。文部科学省が2012年12月に発表した調査結果では、日本では、通常学級に在籍する学習面に著しい困難を示す児童生徒は4.5%である(15)。これらの生徒の多くはディスレクシア等の障害を持ち、教科書・教材および試験問題を読めていない。音声とテキストの入ったEPUB3/DAISYのようなアクセシブルな電子出版物があれば、内容を理解できて授業に参加できるはずの児童生徒も多い(16)。読める教科書がない状態で授業を受けなければならない生徒がいるのが現状だ。
必要な図書を必要な時に遅れることなく入手できるようにするため、一度出版されたものをアクセシブルに作り直すのではなくて、最初からアクセシブルな出版をできるようなエコ・システムの構築が喫緊の課題である。このようなエコ・システムの実現のためには、規格の開発から、活用するための製作ツールとワークフロー、流通、再生ツール、人材養成のすべてにおいて、アクセシビリティを考える必要がある。規格もツールも揃ってきたので、それをどう上手く活用するかが、今後の鍵となる。日本語特有のニーズへの対応のためにも日本からも積極的に国際規格の開発に参加することが必要である。
(1) “Visual impairment and blindness”. World Health Organization. 2012-06.
http://www.who.int/mediacentre/factsheets/fs282/en/, (accessed 2013-04-16).
(2) LBSは、現在は「印刷物を読むことに障害がある人々のための図書館分科会(Libraries Serving Persons with Print Disabilities Section」となっている。
“Libraries Serving Persons with Print Disabilities Section”. IFLA. 2013-02-15.
http://www.ifla.org/lpd, (accessed 2013-03-29).
(3) DAISY Consortium. http://www.daisy.org/, (accessed 2013-03-29).
(4) 日本DAISYコンソーシアムの構成団体は、正会員が、公益財団法人日本障害者リハビリテーション協会、特定非営利活動法人支援技術開発機構、社会福祉法人日本ライトハウス情報文化センター、特定非営利活動法人全国視覚障害者情報提供施設協会で、準会員が、NPO法人NaDと社会福祉法人日本点字図書館、賛助会員が、オリンパスイメージング株式会社とケージーエス株式会社である。
日本DAISYコンソーシアム.
http://www.normanet.ne.jp/~jdc/index.html, (参照2013-04-26).
(5) “WBU WIPO treaty”. World Blind Union.
http://www.worldblindunion.org/English/our-work/our-priorities/Pages/Brief-On-WIPO-Treaty.aspx, (accessed 2013-05-10).
(6) “Specifications”. DAISY Consortium.
http://www.daisy.org/specifications, (accessed 2013-03-29).
(7) International Digital Publishing Forum.
http://idpf.org/, (accessed 2013-03-29).
(8) “EGLS”. e-pub revision.
http://code.google.com/p/epub-revision/wiki/EGLS, (accessed 2013-03-29).
(9) Tobi. http://www.daisy.org/project/tobi, (accessed 2013-03-29).
(10) ONIXコードリスト196のアクセシビリティに関する記述についてはEPUB3アクセシビリティ・ガイドラインに詳細がある。
“ONIX”. EPUB 3 Accessibility Guidelines.
http://www.idpf.org/accessibility/guidelines/content/meta/onix.php, (accessed 2013-03-29).
(11) “村田真のXMLブログ”. XMLマスター.
http://www.xmlmaster.org/murata/, (参照 2013-03-29).
(12) Benetech. http://www.benetech.org, (accessed 2013-04-16).
(13) NCAM. http://ncam.wgbh.org, (accessed 2013-04-16).
(14) DIAGRUMプロジェクトは、プリント・ディスアビリティを抱える生徒が、必要なときに遅れることなく、アクセシブルな教材を入手できるように、図表をより容易に、早く、効率的に、少ない予算でアクセシブルにできるようにするためのプロジェクトで、図表に関わる規格の開発、ツール開発、トレーニングとアウトリーチ、研究等が実施されている。
“DIAGRAM Center”. http://diagramcenter.org, (accessed 2013-03-29).
(15) 文部科学省初等中等教育局特別支援教育課. “通常の学級に在籍する発達障害の可能性のある特別な教育的支援を必要とする児童生徒に関する調査結果について”. 文部科学省. 2012-12-05.
http://www.mext.go.jp/a_menu/shotou/tokubetu/material/__icsFiles/afieldfile/2012/12/10/1328729_01.pdf, (参照 2013-03-29).
(16) デジタル教科書教材協議会のアクセシビリティWG実証研究では、ディスレクシアの生徒が印刷されたテスト問題で試験を受けた場合にほとんど点数がとれなかったのに比べて、アクセシブルなテスト問題を使った場合に平均点がとれたという結果も出ている。
“実証研究プロジェクト L: 読みに困難のある児童の通常の学級でのデジタル教科書・教材の活用”. デジタル教科書教材協議会.
http://121.119.176.71/office/DiTTprjL.pdf, (参照2013-04-16).
[受理:2013-05-15]
濱田麻邑. 次世代DAISY規格と電子書籍規格EPUB3. カレントアウェアネス. 2013, (316), CA1796, p. 15-18.
http://current.ndl.go.jp/ca1796
Mayu Hamada.
Evolution of DAISY Standard and eBook Standard EPUB3.