CA1464 – 本格的電子アーカイブを目指して−アジア歴史資料センターの紹介− / 牟田昌平

カレントアウェアネス
No.272 2002.06.20

 

CA1464

 

本格的電子アーカイブを目指して−アジア歴史資料センターの紹介−

 

1. 公文書館の新しい使命

 岩倉使節団随員,久米邦武編『米欧回覧実記』には,欧米の「博物館」や「書庫」(図書館や文書館)が日本の近代化に不可欠なものとして紹介されている。明治6年5月29日の記録にはベニスの「アルチーフ」(文書館)の書庫に至ると記され,大友宗麟や支倉常長の書簡を実見し「西洋ニ博物館アリ,瑣細ノ微物モ,亦択ンテ蔵ス,書庫ノ設ケアリ,廃紙断片モ亦収録ス,開文ノ至リト云ベシ」と驚嘆した様子が残されている。久米をはじめ使節団の一行は欧米の発展が「旧ヲ棄テ新ヲ争」った結果ではなく,古今東西の知識を蓄え,一般に供した「知ノ開明」にあること,それを「博物館」や「書庫」が担っていることを理解していた(1)

 明治の指導者達は博物館や図書館の建設を奨励した。しかし,文書館が設立されることはなかった。国立公文書館が総理府の一組織として設立されたのは使節団派遣から100年後の1971年である。現在では図書館司書や博物館学芸員は公的な資格となり社会的にも認知されている。しかし,文書専門家である「アーキビスト」は制度として確立したものではない。

 国民の生命に直接かかわるBSE(狂牛病)問題での行政による情報隠蔽でも明らかなように,このような問題が起こるたびに情報公開の必要性が説かれる(2)。しかし,情報公開制度と切り離すことのできない公文書館制度について注目するメディアは少ない。

 このような状況に変化をもたらす可能性を持つ組織が昨年11月に国立公文書館の組織として開設された。アジア歴史資料センター(http://www.jacar.go.jp)である。

 

2. アジア歴史資料センター開設の背景

 アジア歴史資料センター設立は,1994年「歴史図書・資料の収集,研究者に対する支援等」によるアジア近隣諸国の人々との関係改善を目的とした村山総理談話に端を発する。政治的・外交的な要請,公文書館制度,社会の情報化の現状を踏まえて,まず国立公文書館,外務省外交史料館,防衛庁防衛研究所図書館が所蔵する「アジア歴史資料」をインターネットで提供することが閣議決定され,2年間の準備の後,昨年11月30日に開設された。本センターは,現在200万画像13万件を越える目録データを提供する本格的なデジタル・アーカイブである。毎年ほぼ同程度のデータが追加されていく予定である。既にこれまで一部の専門家にしか存在が知られていなかった,日米開戦経緯に関する米国側外交文書を暗号解読した日本側の資料が提供されるなど,内外の歴史研究者から日本近代史研究のあり方そのものを根底から変える試みとして注目されている(3)

 

3. センターの特長

 センターが提供するのは電子画像化された公文書資料である。図書と異なり原則として1点しかないユニークなものである。また,所蔵機関特有の方法で整理分類されており,日本十進分類法に相当するような公文書館共通の整理分類方法はない。そこで既存の分類体系を横断的に整理分類するために提唱されたのが7階層からなる共通整理分類体系である。国際公文書館会議(International Council on Archives : ICA)が提唱する「国際標準記録史料記述:一般原則」(ISAD(G))とわが国の公文書整理の基本単位である簿冊(主題別や時系列に整理され綴じられたもの)を基本の共通単位として,7階層からなる「目録データ階層構造モデル」を設定した。これによって,文書資料整理の国際的な規則である「原秩序尊重の原則」を壊すことなく,異なる所蔵機関の目録データの横断検索が可能となった。さらに,インターネット対応型書誌項目ダブリン・コアに準拠し,わが国の文書管理の実態を考慮した15の目録項目を決定した(4)

 「アーキビスト」による要約が必要とされる「内容」のデータ作成にあたっては,各資料の先頭から300文字程度を原文のまま抽出することを原則とした。これは,図書目録にキーワードを付与する代わりに目次データを入力するようなものである。専門家の手を煩わすことなく内容検索の対象となるデータを大量に増やすことが可能となった。

 さらにインターネットで一般的な自由語検索を可能とするために,原資料に含まれる歴史用語と現在使用されている歴史用語との乖離を埋めるための辞書を作成した。例えば,一般に認知されている「太平洋戦争」は公文書では使用されていない。そこで閣議決定で正式名称として採用されている「大東亜戦争」を同義語として展開して検索できるようにした(5)

 センターの主たる機能は文字コンテンツをいかに早く提供するかである。紙質や色の復元など高画質が必要とされる貴重書画等を扱うバーチャル・ミュージアムとは異なる。そこで文字情報の電子化にあたっては,マイクロフィルムや画像電子化技術の成熟度を勘案して,文字が研究に支障のないレベルで判読でき,情報提供量を最大化できる妥協点として,モノクロ2値,400dpi,TIFFファイルを標準仕様として採用した。さらに現在最高レベルの画像圧縮性能(モノクロ2値ではJPEGの20倍ほど)をもつ次世代型画像フォーマットDjVuを採用した(6)。センターの情報提供システムは,文字がコンテンツの中心となる大量の行政情報公開に新しいモデルを提供するものである。

 センターでは,これまで日本語のみでサービスを行ってきたが7月から英語による検索システムを追加公開する。「いつでも」,「どこでも」,「無料」で利用できるこれまでの機能にインターネットの標準語といえる英語での検索が加わる。これによって,センターの責務とも言える「誰もが」利用できる機能を持つセンターに更に近づくことになる。

国立公文書館アジア歴史資料センター:牟田 昌平(むたしょうへい)

 

(1)久米邦武編 特命全権大使米欧回覧実記 四 岩波書店 1980. p.350-352
(2)日本経済新聞 社説 2002.4.8 
(3)日米開戦以前,日本側が米国の外交文書の暗号解読に成功していたことを裏付ける文書。「特殊情報」で検索することで閲覧が可能。
(4)[ICA編] 記録史料記述の国際標準 北海道大学図書刊行会 2001.164p
(5) 牟田昌平 アジア歴史資料センターについて アーカイブズ 国立公文書館 (8) 34-44, 2002
(6)DjVuの技術的な詳細は[http://www.lizardtech.com]または[http://www.keiyou.co.jp]を参照。(last access 2002.4.30)

 


牟田昌平. 本格的電子アーカイブを目指して−アジア歴史資料センターの紹介−. カレントアウェアネス. 2002, (272), p.11-12.
http://current.ndl.go.jp/ca1464