E1601 - 米国議会図書館が長期保存に適したフォーマット仕様を公開

カレントアウェアネス-E

No.265 2014.08.28

 

 E1601

 

米国議会図書館が長期保存に適したフォーマット仕様を公開

 

 米国議会図書館(Library of Congress:LC)は2014年6月23日,所蔵コレクションの長期保存を実現するため,幅広い種類の創作物を対象とした推奨フォーマット仕様“Library of Congress Recommended Formats Specifications 2014-2015”を公開した。LCには,「米国民の利益のため,知識や創造性の進化を推し進める」という使命がある。この使命を遂行するための根幹となる活動の1つが,知識や創造性を具現化する,巨大なコレクションを構築することである。多様なデジタル形式の創作物が現れる中,このようなコレクションを構築しさらに何世代にもわたる利用を保証するためには,収集や長期保存に適したフォーマットを,幅広い種類の創作物について特定し,運用することが求められてきた。その必要性に応えるものが今回の仕様である。

 この仕様には,大きく分けて二つの目的がある。一つは,LCが資料を収集する際の内なる指針とすることである(著作権局を通じて受け入れるものを除く)。今日では,著作者や出版者は,新しい物理的なフォーマットを採用するのと同様に,無形のデジタルのフォーマットをも幅広く採用し始めている。このような状況を踏まえ,長期保存の適性という観点から資料を収集する際のフォーマットの指針を示しているのである。なお,この仕様は,「推奨」とされているとおり,それ以外のフォーマットを排除するというものではなく,複数のフォーマットで作られた資料の収集にあたり,最適なフォーマットを決定する際の一助とするものとして位置づけられている。

 もう一つの目的は,米国や世界の著作物の,長期利用保証を実現するための最良の方法を,著作者や図書館のコミュニティと共有することである。LCは米国のコレクションの保存の第一線に立つ機関であり,LCによる仕様の策定は,将来にわたり著作物を生き永らえさせ,利用可能なものとするという目標を共有する,すべての関係者の支援につながるものとして位置づけられている。

 仕様の策定にあたりLCは,著作物の制作や出版業界に詳しい組織内の専門家を招集して検討を行い,著作物を大きく六つのカテゴリーに分け,それぞれのカテゴリーについてフォーマット仕様を決定した。六つのカテゴリーは,次のとおりである。

  • 文字資料や楽譜(Textual Works and Musical Compositions) 
  • 静止画資料(Still Image Works) 
  • 録音資料(Audio Works) 
  • 動画資料(Moving Image Works) 
  • ソフトウェア,電子ゲーム,電子教材(Software and Electronic Gaming and Learning) 
  • データセット/データベース(Datasets/Databases)

 それぞれのカテゴリーはさらに,文字資料であれば印刷資料,デジタル資料(電子書籍ほか),電子雑誌など,形態別に細分化されている。そして,例えば,文字資料の印刷資料では,国際標準化機構(ISO)の規格(ISO 11108:1996)に準じた記録紙の使用や,米国情報標準化機構(NISO)の規格(NISO Z39.78-2000)に準じたハードカバーの綴じ方など,好ましい仕様が具体的に示されている。また,文字資料のデジタル資料では,EPUBなど,XMLに準拠したマークアップ言語等で記述されるフォーマットや,PDFなど,異なる環境においてもページレイアウトを再現できるフォーマットなどが推奨されている。

 このように,仕様の特徴として,アナログ,デジタルの一方を前面に押し出すのではなく,デジタルのフォーマットをアナログのフォーマットの対応物として,並列して記述していることがあげられる。この点について,仕様の策定を監督してきた,ウェスターベルト(Ted Westervelt)氏(芸術,人文・自然科学分野に係る国内逐次刊行物の収集整理部門の責任者)は,LCのブログに掲載されたインタビュー記事の中で,次のように述べている。「LCは現時点で,アナログ資料を収集するのと同等の規模や範囲で,デジタル資料を収集しているわけではないが,多くの分野で,アナログのフォーマットと同等に,デジタルのフォーマットでもコンテンツが制作されてきている。このため,アナログ資料とデジタル資料を切り離して考えることは,もはやできない」

 また,仕様には,「デジタル著作権管理(Digital Rights Management: DRM)や暗号化など,デジタル資料へのアクセスや利用を制御する,いかなる仕組みもファイルに含まれるべきではない」という文言が,繰り返し登場する。ウェスターベルト氏は,DRMが,制作に要した時間やエネルギー,費用に対する,正当な報酬を得ようとする試みであることは理解できるとしながらも,DRMや暗号化が,資料の保存や,長期の利用保証を実現する際の障壁になることを,改めて指摘している。

 LCは,目まぐるしいフォーマットの変化に対応し,創作の世界の発展に取り残されないよう,フォーマット仕様を毎年見直すとしており,内容の追加の提案や意見等を求めている。

関西館電子図書館課・本田伸彰

Ref:
http://www.loc.gov/today/pr/2014/14-111.html
http://www.loc.gov/preservation/resources/rfs/rfs20142015.pdf
http://www.loc.gov/preservation/resources/rfs/
http://blogs.loc.gov/digitalpreservation/2014/06/recommended-format-specifications-from-the-library-of-congress-an-interview-with-ted-westervelt/
http://www.iso.org/iso/catalogue_detail.htm?csnumber=1708
http://www.niso.org/standards/z39-78-2000R2006/