3. 平成16年度 調査報告 3.3. ハードディスクへのマイグレーション

3.3.ハードディスクへのマイグレーション

3.3.1.マイグレーションの試行

 平成15年度の調査では主にPCで再生されることを前提に作成されたパッケージ系電子出版物を調査対象としたが、この中には、Macintosh用、PC-98用のソフトウェアや、5"FDが含まれている。国立国会図書館のパッケージ系電子出版物において、PC用の資料の大半はPC/AT互換機用のソフトウェアであり、媒体の殆どはCD-ROMであることを考慮すれば、PC/AT互換機用のCD-ROMに絞って調査することが適切であると思われる。したがって、調査対象は以下のものとした。

【調査対象】

 Windows用またはDOS用のソフトウェアを収録したCD-ROM/R/RWで、平成11年度以前に受け入れた国内刊行の電子資料を対象としてサンプル354点(14)を選択した。

 「平成11年度以前」としたのは平成15年度の調査と同一期間を対象とするためである。また、「国内刊行」としたのは、国内刊行のものを外国刊行のパッケージ系電子出版物より優先的に扱うべきであることと、外国刊行のものは文字コードなどの問題があるため必要以上に問題領域が広がる可能性があるためである。


(1)結果

 対象とした電子資料について市販のマイグレーションプログラム(15)を使用してCD-ROMからハードディスクへのマイグレーションを行った。その結果は以下の通り。


表3.3-1 マイグレーション結果一覧
表3.3-1 マイグレーション結果一覧

※ 失敗の2点は、マイグレーション処理時間が1時間経過しても終了しなかったため、処理を中断した。


(2)データ圧縮状況

 マイグレーションプログラムにデータ圧縮機能(16)が付随している。圧縮を行った結果は以下の通り。平均すると6割程度に圧縮(17)されることがわかった。


表3.3-2 マイグレーション圧縮状況
表3.3-2 マイグレーション圧縮状況

※平均圧縮率は各電子資料の圧縮率(18)を平均して求めた。


図3.3-1 マイグレーション前後のデータ容量分布状況
図3.3-1 マイグレーション前後のデータ容量分布状況


図3.3-2 マイグレーションのデータ圧縮分布状況
図3.3-2 マイグレーションのデータ圧縮分布状況


3.3.2.マイグレーション所要時間

 352点の電子資料のマイグレーション作業に要した所要時間は、約16時間(19)である。平均すると、電子資料1点あたりのマイグレーション時間は、約3分弱であった。


表3.3-3 マイグレーション所要時間
表3.3-3 マイグレーション所要時間


 しかし、これはマイグレーション作業で使用した環境特有(20)の結果でしかなく、将来の移行作業のためには、資料点数や、マイグレーション環境から所要時間が推測可能であることが望ましい。マイグレーション所要時間は、マイグレーションを行う資料の点数、データ量や、CD読出し速度、メモリ容量、CPU能力、ハードディスク速度、バス速度などにより求められると思われる。


図3.3-3 マイグレーション処理イメージ
図3.3-3 マイグレーション処理イメージ


3.3.3.技術要素が所要時間に及ぼす影響

 マイグレーション所要時間に影響すると思われる技術要素のうち、転送速度によって比較できる要素としては、CD読出し速度、ハードディスク(以下表中、「HDD」)速度、バス速度などが考えられる。これらの転送速度を比較するとCD読出し速度が極端に遅いことがわかる。


表3.3-4 転送速度の概算
表3.3-4 転送速度の概算


 このことから、転送速度という性能指標で比較可能な技術要素のうち、マイグレーション所要時間に最も影響する技術要素はCD読出し速度であると推測できる。

 また、バス速度はCD読出し速度と比べて著しく高速であるため、マイグレーション所要時間には影響しないと推測した。ハードディスク速度についても影響しないと思われるが、転送速度の最も遅い技術要素が影響するということを確認するためにも調査対象とした。

 また、転送速度以外でマイグレーション所要時間に影響すると思われるのは、CPU能力、メモリ容量があるが、これらの技術要素は同一の基準では比較できないことと、更に、マイグレーションにとって、どちらかが常にボトルネックの技術要素になるとは考えにくい。よって、いずれかのみを調査対象として選別せずに双方を調査対象とした。

 以上のことから、マイグレーション所要時間に影響する技術要素を以下の4点に絞って調査することにした。

(1) CD読出し速度

(2) ハードディスク速度

(3) CPU能力

(4) メモリ容量


(1)調査方法

 調査対象の技術要素の変更が所要時間に与える影響を把握するために、調査対象外の技術要素を固定し、調査対象の技術要素の性能のみを変えて、99MB、351MB、649MB(21)のCD-ROMをマイグレーションし、所要時間を計ることとする。マイグレーションプログラムではマイグレーション時にデータ圧縮の有無を指定できるため、調査では圧縮する場合、しない場合のそれぞれを調べた。


(2)CD読出し速度の影響

 CD読出し速度を24倍速、40倍速に切り替えて処理時間を調査した。


表3.3-5 マイグレーション処理時間比較・CD速度
表3.3-5 マイグレーション処理時間比較・CD速度


図3.3-4 マイグレーション処理時間比較・CD速度(圧縮なし)
図3.3-4 マイグレーション処理時間比較・CD速度(圧縮なし)


図3.3-5 マイグレーション処理時間比較・CD速度(圧縮あり)
図3.3-5 マイグレーション処理時間比較・CD速度(圧縮あり)


 測定の結果、CD読出し速度が高速になると、マイグレーション処理時間は明らかに短縮された。

 ある程度高速なCDドライブでは、角速度一定方式(22)という方法で読出しが使われることが多い。角速度一定方式では、CD-ROMの内周ではデータ転送速度は遅く、外周に進むにつれて高速にデータが読み出されることになる。そのため、CD-ROMに記録されているデータの径によって、平均データ転送速度は変化する。

 そこで、平均的な容量である351MBのCD-ROMをマイグレーションした際の処理時間を基に、角速度一定方式でのおおよその処理時間を求めてみた。


351[MB] ÷ 85[秒] ≒ 4[MB/s]  :40倍速時に、1秒当たりに読出せるデータ量

4[MB/s] ÷ 40[倍速] = 0.1[MB/s](23)  :1倍速相当時に読出せるデータ量

マイグレーション処理時間概算[秒] ≒ CD-ROMデータサイズ[MB] ÷ ( 0.1[MB/s] × 読出し速度[倍速] )


 ただし、CD-ROMの容量が小さい場合は求めた概算時間より余分に処理時間(24)がかかり、CD-ROMの容量が大きい場合は概算時間より若干短縮(25)される。これは、小容量では平均転送速度が遅く、大容量では平均転送速度が速いためである。

 40倍速時に649MBのCD-ROMを圧縮ありでマイグレーションした場合、処理時間が長くなっているが、これはCPUの処理が追いつかず、処理時間に遅れが発生したためである。(「(4) CPU能力の影響」を参照)


(3)ハードディスク速度の影響

 ハードディスクの能力が処理時間に与える影響を調査した。予想通り一般的なハードディスク速度では、ほとんど影響がないことが判明した。


表3.3-6 マイグレーション処理時間比較・ハードディスク速度
表3.3-6 マイグレーション処理時間比較・ハードディスク速度


図3.3-6 マイグレーション処理時間比較・ハードディスク速度(圧縮なし)
図3.3-6 マイグレーション処理時間比較・ハードディスク速度(圧縮なし)


図3.3-7 マイグレーション処理時間比較・ハードディスク速度(圧縮あり)
図3.3-7 マイグレーション処理時間比較・ハードディスク速度(圧縮あり)


(4)CPU能力の影響

 CPU能力が処理時間に与える影響を調査した。


表3.3-7 マイグレーション処理時間比較・CPU能力1
表3.3-7 マイグレーション処理時間比較・CPU能力1


図3.3-8 マイグレーション処理時間比較・CPU能力1(圧縮なし)
図3.3-8 マイグレーション処理時間比較・CPU能力1(圧縮なし)


図3.3-9 マイグレーション処理時間比較・CPU能力1(圧縮あり)
図3.3-9 マイグレーション処理時間比較・CPU能力1(圧縮あり)


 CDイメージを圧縮しない場合、CPU能力による処理時間の差は誤差の範囲である。これは、圧縮処理を行わない場合CPUには殆ど負荷が掛かっておらず、CD-ROMから読み出したデータを滞りなくハードディスクに書き込むことができるためであると考えられる。

 CDイメージの圧縮を行い、CDドライブから送られる秒あたりのデータ量が増えた場合には、性能の低いCPUにとっては負荷となり、処理時間が長くなる傾向が読み取れる。

 データはCD-ROMの内側から記録されるために、CD-ROMのデータ記録容量が少ない場合は、角速度一定方式の読み取りではデータ転送速度は低く、単位時間あたりのデータ読み出し量が圧縮処理可能なデータ量より少ないために、圧縮の有無はマイグレーション処理時間に影響しないと思われる。

 しかしCD-ROMのデータ量が増加すると、データの記録領域がCD-ROMの外周に近づき、データ転送速度も増加してCD読出し速度やCPU性能によっては単位時間あたりのデータ読み出し量が圧縮処理可能なデータ量を上回るためにマイグレーション処理時間に影響すると考えられる。

 これを確認するために、CD読出し速度を8倍速と低速に設定し、単位時間あたりにCPUに供給されるデータ量を少なくした場合のマイグレーション処理時間(圧縮あり)を計測した。


表3.3-8 マイグレーション処理時間比較・CPU能力2
表3.3-8 マイグレーション処理時間比較・CPU能力2


 このように、単位時間あたりのCPUに供給されるデータ量が、CPUの処理能力を超えない場合は、CPU能力によるマイグレーション処理時間に差は現れない。

 以上により、CPU能力の差については、以下のように結論付けることができる。

(1) CDイメージの圧縮を行わない場合
 CPU能力はマイグレーション処理時間に影響しない。

(2) CDイメージの圧縮を行う場合
 単位時間あたりのCPUに供給されるデータ量がCPU処理能力を下回るときは、CPU能力はマイグレーション処理時間に影響しない。しかし供給されるデータ量がCPU処理能力を超えるときは、CPU能力がマイグレーション処理時間に影響する。


(5)メモリ容量の影響

 メモリ容量が処理時間に与える影響を調査した。一般的なメモリ容量ではほとんど影響がないことが判明した。


表3.3-9 マイグレーション処理時間比較・メモリ容量
表3.3-9 マイグレーション処理時間比較・メモリ容量


図3.3-10 マイグレーション処理時間比較・メモリ容量(圧縮なし)
図3.3-10 マイグレーション処理時間比較・メモリ容量(圧縮なし)


図3.3-11 マイグレーション処理時間比較・メモリ容量(圧縮あり)
図3.3-11 マイグレーション処理時間比較・メモリ容量(圧縮あり)


3.3.4.考察

(1) マイグレーションの実施

 市販のマイグレーション用プログラムを使用したが、殆どの電子資料をマイグレーションできたことを考慮すれば、マイグレーション自体は比較的容易に実施可能だと言える。

(2) マイグレーション後ファイル形式

 マイグレーションによりハードディスクに作成されるファイル形式が、マイグレーションプログラムの固有の形式となってしまうために、マイグレーション後の電子資料の長期的な利用は困難となる。この形式のファイルを使い続けるためには、同じマイグレーションプログラムを使い続けなくてはならないが、OSのバージョンアップなどにより使用できなくなることが考えられる。バージョンアップしたマイグレーションプログラムが旧バージョンで作成されたファイルには対応しない可能性や、マイグレーションプログラムの販売が中止される可能性もある。

 マイグレーションプログラムを使用しないでファイル単位でのコピーによるマイグレーションを実施するという方法も考えられるが、コピープロテクトを回避できない可能性や、CDドライブから再生する前提で作成されているためにハードディスク上のファイルからでは実行できない可能性がある。

(3) マイグレーション所要時間

 1枚あたりのマイグレーション所要時間は、CD-ROMの容量とCDドライブの読出し速度により決まる。マイグレーション時にデータ圧縮を行う場合には、CPU能力が影響する場合がある。CDドライブはその他の技術要素と比べて読み出し速度は非常に遅く、その読出し技術もメディアを回転させることによる振動や空気抵抗などの物理的要因からすでに限界にあると言われており、今後の大きな進歩はないと思われる。このため将来においてもCD読出し速度がマイグレーションの所要時間を決める要因であることは変わらないと思われる。

(4) その他の媒体のマイグレーション

 この調査ではCD-ROMを対象として調査したが、DVDも多数納本されている状況を鑑みれば、これについても同様の調査を実施する必要があると思われる。

(5) マイグレーションプログラムの要件

 電子資料の長期保存とアクセス手段確保という目的からするとマイグレーションプログラムは次のような要件を備えていなくてはならないと言える。

● プログラムの移行などにより長期間使用可能であること。

● マイグレーション後のファイル形式が長期間使用可能なものであること。マイグレーションプログラムのバージョンアップにともない使用不可能とならないこと。

● マイグレーション後のファイルがCD-ROM上に存在するものとして扱えること。

● コピープロテクトが施されたCD-ROMもマイグレーションできること。

 しかし、現時点ではこれら課題の解決策は見出されていない。引き続き検討すべき課題である。




(14) 後に行うプログラムを含む電子資料の再生確認とデータのみの電子資料の再生確認のために、それぞれ100点づつマイグレーションする必要がある。しかし、目録などから、「プログラムを含む電子資料」と「データのみの電子資料」を判断することは困難であり、実際に再生確認などを行わない限り判別はできないため、「プログラムを含むと思われる電子資料」と「データのみと思われる電子資料」を予備を含めて選んだ。

(15) 「CD革命/Virtual Pro ver.8」((株)アーク情報システム)を使用した。製品の評価ではなく一般論としての結果を導くことを目的とした。

(16) 圧縮方式については公開されていない。メーカー固有の技術と推測される。

(17) この数値は、この調査におけるサンプル特有のものである可能性と、マイグレーションに使用したプログラム特有のものである可能性があることに注意すべきである。

(18) 圧縮後容量÷圧縮前容量×100とした。

(19) マイグレーションプログラムの処理時間の合計。即ち、CDの付け替え時間などは含んでいない。

(20) 使用したハードウェアのCD読出し速度は24倍速である。

(21) マイグレーション作業において、実際のデータ容量の分布状況からサンプルとして小さめ、平均、大きめの3種類を選択した。

(22) CDの回転速度を固定して読出す方式。

(23) 24倍速でも、351MB÷142秒≒2.47MB/s、2.47MB/s÷24倍速≒0.1 MB/sとなる。

(24) 平均的容量(351MB)より小さい99MBの場合、99MB÷4MB/s≒25秒となるが、実際は31秒であり概算時間より6秒長くかかっている。

(25) 平均的容量(351MB)より大きい641MBの場合、641MB÷4MB/s≒160秒となるが、実際は150秒となり概算時間より10秒短くなっている。