PDFファイルはこちら
カレントアウェアネス
No.279 2004.03.20
CA1520
動向レビュー
デジタル情報の長期的な保存にともなう経済的課題
0.貧乏はつらいよ
何をするにも金がかかるが,デジタル情報の長期保存はなおさらである。
米国議会図書館が主導する,全米デジタル情報基盤整備・保存プログラム(NDIIPP)は,予算規模1億ドルのプロジェクトである。このプロジェクトは,電子情報を長期に保存するための全米規模の基盤整備を行うことを目的として,2000年12月の立法措置により開始されているが,全米デジタル情報基盤整備・保存プログラムの立案とその実行だけでも2,500万ドルを投じることになっている(CA1502参照)。
デジタル情報の長期的な保存に伴う課題は多岐に及ぶが,コストは大きな課題である。
デジタル情報の長期保存には,紙媒体の資料の保存と比べて非常にコストが掛かる。それは,はるかに多くの資源を媒体保存以外の行為に割かなくてはならないからである。デジタル情報を再生するためには,そのための環境,つまり,特定のハードウェアとソフトウェア(これもデジタル情報であるが)を必要とする。しかし,次の事情を考慮しなくてはならない。
ハードウェアの寿命は短い:
ハードウェアも媒体とともに保存すればよい,とはいかない。電子回路中でもっとも寿命が短いと言われる電解コンデンサは種類・周囲の温度にもよるが10万時間未満,外部記憶装置に使用されるモータの寿命は長寿命のものでも10万時間程度である。ソフトウェアの使用可能期間は限定されている:
多くの場合,再生用のアプリケーション・プログラムを動作させることでユーザーはデジタル情報にアクセス可能となる(ゲームソフトなどのアプリケーション・プログラムはそれ自体がアクセス対象のデジタル情報である)。しかし,その再生用アプリケーション・プログラムがいつまでも入手可能であることはなく,そのアプリケーション・プログラムを保有していても最新版のOSでは動作しないことがある。また,古いOSは最新版のハードウェアでは動作しないことが多い。アプリケーション・プログラムはその設計時に流通しているOSで動作することを前提に,OSはその設計時に流通しているハードウェアで動作することを前提につくられているからである。
つまり,再生対象のデジタル情報が,古い特定の環境で再生されることを前提に作られているにもかかわらず,最新の環境で再生させることを考えなくてはならないのである。そのためには,古い特定の環境を擬似的に最新の環境で再現すること(エミュレーション)や,最新環境用にデータの記録形式を変換すること(マイグレーション),最新環境で動作するように作り直すこと(移植)が必要になる。
また,媒体やデジタル情報の記録形式についても配慮が必要である。
寿命:
デジタル情報記録用媒体の寿命は紙媒体と比べて非常に短い。保存環境にもよるが20〜30年程度であるといわれている。はやり廃り:
技術の進歩などにより,数多くの種類の媒体が生まれる一方,廃れて入手不可能となる種類もある。媒体に記録されたデジタル情報にアクセスするためにはその媒体に対応した機器が必要であるが,最新の機器が廃れた媒体に対応しているとは限らず,機器の寿命も既に述べたように短い。記録形式:
データは特定の形式で媒体に記録されており,その形式はアプリケーション・プログラムやOS,媒体など,それぞれレベルで規定されている。古いアプリケーション・プログラム,古いOS,古い媒体の記録方式では,最新の環境ではアクセスできないことがある。
つまり,デジタル情報は,定期的に新しい媒体に移しつづけなくてはならないが,別種の新しい媒体に移し替える必要もあり,記録形式が古くなった場合は新しい記録形式に変換しなくてはならない。
また,デジタル情報の長期保存にはそのためのメタデータも必要である。再生に必要な環境(CPU,OS,アプリケーション・プログラム,メモリサイズ,周辺機器など)を記述するメタデータは当然のこと,作成プロセスやマイグレーション履歴などの来歴を記述するメタデータ,チェックサムなどの内容改変防止のためのメタデータ,などである。
1.コストモデル
さて,ようやく本題である。
前述の事情が理解されている各国の図書館関係者には,長期間の保存をする場合,デジタル情報のほうが,従来型の資料より多くの資源を継続的に投入しなくてはならないということは共通の認識であり,経済的課題に関係する様々な調査や研究がなされている。
米ハーバード大学図書館の保管庫(Harvard Depo-sitory)とOCLCのデジタルアーカイブの保管料金からデジタル情報の長期保存という枠組みの中のごく一部である「保管」について考察した報告がある(1)。
どちらの保管庫も,保管庫に占める割合(大きさ〔Harvard Depositoryの場合〕・容量〔Gbyte;OCLCデジタルアーカイブの場合〕)に応じた年間保管料金が定められており,保管に伴うデジタルと非デジタルの費用比較ができたのであるが,比較結果は,デジタル情報の形式(テキスト形式,モノクロビットイメージなど)により1ページあたりのバイト数が増減し,紙媒体の保管料金より安くなる(1/30〜1/5;テキスト形式の場合)場合と,高くなる(1.5倍〜6倍;解像度による)場合があり,マイクロフィルムと比べると,テキスト形式の場合は1/8〜8倍,モノクロビットイメージの場合は,6〜23倍の費用となる,というものである。
この他にも,印刷物を管理,保存するコストと比べてデジタル出版物のそれは20倍にもなるとの試算(2)や,16倍であるとの報告がある一方,デジタル情報の保存とアクセスのための年間コストは10年後には当初の半分以下となるが,紙媒体の資料の保存とアクセスの年間コストは10年後には約1.5倍になり,年間コストがデジタル情報の保存のほうが安くなるとの試算(3)もある。(この試算では初年度のコストはデジタル情報の長期保存コストのほうが約2倍であり,10年間のコスト合計はデジタル情報の長期保存の方が多少高くなること,扱うデータの形式がTIFF形式のみであることを考えると,容易にどちらが安いといえるものではない。)
このような,算定された保存コストの違いは,保存機関の戦略や保存対象,認識しているコスト要因などの違いによるものである。算定方法の類型化はできないものの,コスト発生領域を特定し,コスト要因を抽出するという方法を海外プロジェクトでは多く採用している。
そのコスト発生領域であるが,データ作成,選択・評価(受入),データ管理,資料公開,データ使用,データ保存,権利管理の7つとするものや,選択,権利交渉,技術戦略立案,受理オブジェクトの検証,メタデータ生成,ファイル保管,アーカイブ管理とするものなど,細部に違いはあるものの大筋では一致していると考えてよい。参考までに,英国のCedars(CURL Examplars in Digital Archives;CA1501参照)プロジェクトで報告されたコストモデルを表1に記す(4)。
コスト領域 | コスト要因 | |
---|---|---|
1 | 選択 | ・コレクションポリシー |
2 | 保存のための権利交渉 | ・権利交渉に要する時間 |
3 | アクセスのための権利交渉 | ・権利交渉に要する時間 |
4 | 保存とアクセスのための技術戦略 | ・アクセスを維持するための保存戦略決定に要する資源 ・メタデータ要素の決定 ・保存のための要求技術決定 ・システム調達・設計 |
5 | 受理オブジェクトの検証 | ・必要なドキュメント入手に要する時間 ・オブジェクト検証に要する時間 |
6 | メタデータ生成 | ・添付ドキュメントの調査 ・既存の目録・メタデータ利用の可能性 |
7 | ファイル保存 | ・保守費用、購入費用 ・記憶媒体の世代間コピー ・バックアップ作成 |
8 | アーカイブ管理 | ・人件費 ・技術開発費用 ・法的処理に伴う費用 ・アーカイブポリシーの変更に伴うシステム改変費用 ・保険 ・施設費 |
このようなデジタル情報の長期保存のコストモデルの調査・検討はある程度の進展を見ることができるものの,実際にコストを量ることは難しく,一般化することも困難である。各地で実施中のプロジェクトから得られるコストに関するデータが不足している上,コストは多数の変数からなる関数であるにもかかわらず,やっかいな変数が多い。保存期間,ストレージ技術,提供するサービス,保存目的,保存戦略,フォーマットの多様性,メタデータ記述の精度などである。
また,正確なコスト見積には,それなりに保存プロセスを詳細化する必要がある。しかし,デジタル情報の長期保存活動は多様であり,詳細化と一般化の両立は困難である。
2.インセンティブ
コストモデルの検討やそれ自体は,デジタル情報を長期的に保存することを暗黙の前提としているが,そもそもデジタル情報の長期保存を引き受ける機関がどれほどあるのか。
デジタル情報の長期保存についての取り組みや,そのための調査や研究がほとんど行われていない我が国のことを考えると,保存するインセンティブを形成することの方が重要であるように思われる。
財やサービスが取引される場が市場であるが,デジタル情報の長期保存サービスについての市場というものを考えてみる。市場には,売り手と買い手が存在し,いずれも自発的に取引に参加している。彼らは,何ら強いられることなく自らの利益に合致するように行動している。つまり,インセンティブがあるからそうするのであるが,デジタル情報の長期保存サービスについても同様のインセンティブはあるだろうか。
デジタル情報は脆弱でメンテナンスしつづけない限りダメになったり旧式化してしまうものである。デジタル情報の所有者には,貴重なデジタル情報を延命させるために長期保存サービスを購入する十分な理由がある。
しかし,実際にはデジタル情報の長期保存は,経済的にも技術的にも未成熟な分野であり,経済的に持続可能なデジタル情報の長期保存を行うことには多くの不確実性が伴う。意思決定を行うものにとって,経済的活動としてのデジタル情報の長期保存は考慮すべきリスクであり初期投資に見合う十分な利益は生まないと考えられている。
なぜインセンティブがないのか,どうすればそれが形成されるのかを理解することが,デジタル情報の長期保存の分野における経済的な難問である。
繰り返しの使用が可能なデジタル情報は耐久消費財といえるが,耐久消費財につきもののアフターマーケットで提供されるサービスが,デジタル情報の場合は長期保存サービスであるといえないだろうか。アフターマーケットとは,耐久消費財の価値や使い勝手,寿命を増大させる財・サービスが売買される市場である。自動車の場合,芳香剤やカーナビ,プーさんシートカバーなどが扱われている。デジタル情報の長期保存を考える場合,アフターマーケットの問題は少々複雑になる。デジタル情報の長期保存サービスでは,便益を得る主体が必ずしもデジタル資源を保有している主体ではないからである。
デジタル情報の長期保存においては,経済的意思決定者には次の3つの基本的な役割がある。
- 権利保有者−デジタル情報の権利をもつ主体
- 受益者−デジタル情報が長期保存されることで便益を得る主体
- アーカイブ−長期保存サービスを実行する主体
これらの役割が単一の主体によって果たされるのか,2つまたは3つの主体によって果たされるのかで,デジタル情報の長期保存が行われるモデルを分類することができる(5)。
- (1)求心的モデル:権利保有者,アーカイブ,受益者が単一の主体の場合
- (2)遠心的モデル:権利保有者,アーカイブ,受益者が全て異なる主体の場合/li>
- (3)供給側モデル:権利保有者でありアーカイブである主体と,受益者である主体からなるモデル/li>
- (4)需要側モデル:権利保有者であり受益者である主体と,アーカイブである主体からなるモデル/li>
- (5)アーカイブ・受益者結合モデル:アーカイブであり受益者である主体と,権利保有者である主体からなるモデル
デジタル情報の長期保存が行われるシナリオは多岐に渡るが,上記5つのモデルに整理可能である。では,インセンティブが減退する要因はなにか。
- (a) 権利保有者がデジタル情報の長期保存が利益を生むとは考えていないこと。権利保有者と受益者が異なる主体となる,上記(2)(3)(5)のモデルで起こり得る。
- (b) 同様のデジタル情報をもつ主体が複数存在する場合は,いずれの主体も他が長期保存をはじめることを当てにしていること。権利保有者と受益者が同じ主体となる,上記(1)(4)のモデルで起こり得る。
- (c) 求められているサービスのレベルが多岐に渡り,個別に応じるとスケールメリットがなくなること。受益者とアーカイブが別の主体となる,上記(2)(3)のモデルで起こり得る(表2参照)。
これらインセンティブ減退への対処法としては,
- (a) 受益者から権利保有者に対価が支払われる仕組み,権利保有者への助成金などの導入
- (b) 税金による長期保存費用の負担
- (c) スケールメリットが生まれるような,様々なサービス範囲に適用可能なサービス提供インフラの導入などが挙げられる。
3.実際の例
「JSTOR」(http://www.jstor.org/)という非営利団体がある。JSTORは出版者から権利を得て学術雑誌を電子化し,サイトライセンスを得た機関に対しウェブで利用可能とするサービスを提供している。
JSTOR,出版者,ユーザー(サイトライセンスを得た機関)は,上述の枠組みで言えば,アーカイブ,権利保有者,受益者となり,それぞれ別の主体なので(2)遠心型モデルとなる。
(2)遠心型モデルには,権利保有者が便益を認識していない,多様な需要に応じるとスケールメリットがなくなるというインセンティブ減退要因があるが,JSTOR自体が受益者から権利保有者へ対価支払いのための仕組みであること,全ての受益者に対して同じサービスを提供することにより事業が成立したといえるだろう。
他の例であるが,JPモルガンが提供している「I-VAULT!」(https://www.myimagearchive.com/)というサービスがある。デジタルイメージ保管のアウトソーシングサービスと言っても良いサービスであるが,I-VAULT!とユーザーの関係は,アーカイブと権利保有者兼受益者の関係であり,(4)需要側モデルとなる。(4)需要側モデルには,同等の資料をもつ主体が複数ある場合に他の主体が保存を始めることを期待してしまう,多様な需要に応じるとスケールメリットがなくなるというインセンティブ減退要因がある。I-VAULT!の場合は,預けたユーザー本人のみが預けた情報にアクセスでき,扱う情報をデジタルイメージのみとすることにより,インセンティブを生み出したと言える。
おわりに
文書ファイル,静止画像などの静的なデジタル情報であれば,マイクロフィルム化して保存することもある程度有効かもしれない。従来の枠組みをほぼそのまま使うことができる上,コスト的にもデジタルのまま保存しつづけるより優位であろう。しかし,静的な情報であっても,データベースに収載されている内容やハイパーテキストなどは,紙やマイクロフィルムに出力した時点で,総体として実現している価値を失ってしまう。まして,動画やゲーム,マルチメディアには対応できない以上,デジタルをデジタルのまま維持しつづけることに伴う困難はすべて乗り越えるべきものとして取り組むべきではないだろうか。
「遅れていない国々」ではデジタル情報の長期保存は,文化遺産や情報を管理する機関にとっての最重要事項となっている。
これら国々ではデジタル情報の長期保存というトピックには目新しさなどはなく,小規模な実験プロジェクトから,日常業務と化したデジタル資産のライフサイクルマネジメントにおける一部分になり,どのように経済的に持続可能なプロセスとして具体化するかということが問題になっている。
さて,日本は。国立国会図書館は。
関西館事業部電子図書館課:今野 篤(こんのあつし)
(1)Chapman,S. Counting the Costs of Digital Preservation: Is Repository Storage Affordable? Journal of Digital Information. 4(2),2003.(online),available from < http://jodi.ecs.soton.ac.uk/Articles/v04/i02/Chapman/chapman-final.pdf >,(accessed 2003-12-25).
(2)Phillips,Margaret. Ensuring Long-Term Access to Online Publications. Journal of Electronic Publishing. 4(4),1999.(online),available from < http://www.press.umich.edu/jep/04-04/phillips.html >,(accessed 2004-02-06).
(3)RLG. Preserving Digital Information: Report of the Task Force on Archiving of Digital Information.(online),available from < http://www.rlg.org/ArchTF/tfadi.index.htm >,(accessed 2003-12-25).
(4)Russell,K. et al. Cost elements of digital preservation. Cedars. (online),available from < http://www.leeds.ac.uk/cedars/colman/CIW01r.html >,(accessed 2003-12-25).
(5)Lavoie,B.F. The Incentives to Preserve Digital Materials:Roles,Scenarios,and Economic Decision-Making. OCLC,2003,45p.(online),available from < http://www.oclc.org/research/projects/digipres/incentives-dp.pdf >,(accessed 2003-12-25).
Ref.
RLG. Trusted Digital Repositories: Attributes and Responsi-bilities. 2002,62p.(online),available from < http://www.rlg.org/longterm/repositories.pdf >,(accessed 2003-12-25).
今野篤. デジタル情報の長期的な保存にともなう経済的課題. カレントアウェアネス. 2004, (279), p.12-16.
http://current.ndl.go.jp/ca1520