第2章 第2節 調査結果の概要

 

1 第1次調査結果の概要

 

(1)デジタルアーカイブ等の実施・運営状況

 全体の26.6%の機関がデジタルアーカイブ等を実施・運営していると回答しており,計画中の機関は11.1%,実施・運営しておらず計画もない機関は61.9%という結果であった。全体の結果に対し,国立大学図書館では98.6%が実施・運営しているほか,都道府県立図書館(65.9%)や政令指定都市立図書館(54.5%)の実施・運営率が高いなど,設立母体,規模によって違いがある。

 なお,今回の調査では「デジタルアーカイブ等」の定義として提供システムや収録コンテンツの質や量について特に基準を設定せず,所蔵資料等をデジタル化したデータが一定量蓄積され,何らかの形で分類・整理され共有されているものであれば,小規模で簡易なものや非公開のものも調査対象とした。そのため,例えばウェブページ上のテキストから画像ファイルにリンクするだけの簡易なものや,職員のみが利用するもの,ウェブ対応していないものも含まれる。また,本格的なシステムが使われていても現在更新されていないもの,他機関と共同運営のものなどについては,機関によって「実施・運営している」と回答するかどうかの判断に違いがあったものと考えられ,注意が必要である。

 

(2)デジタルアーカイブ等を実施・運営していない理由

 デジタルアーカイブ等を実施・運営していない機関に対してその理由を複数回答で尋ねたところ,「予算がない」(79.7%),「人員がいない」(74.2%),「実際的なノウハウがない」(59.4%),「著作権処理が困難」(29.9%)という結果となった。

 

(3)デジタルアーカイブ等の担当者

 デジタルアーカイブ等を実施・運営している機関に対して担当者の有無を尋ねたところ,全体では「兼任者がいる」(64.2%)が最も多く,次いで「いない」(21.5%),「専任者がいる」(8.0%)という結果であり,専任の担当者がいる機関は1割に満たない。

 

(4)デジタルアーカイブ等の概要

 デジタルアーカイブ等を実施・運営している機関に対してアーカイブの概要について尋ねたところ,計815件のアーカイブについて回答があった。実施・運営している機関の約2割は複数のアーカイブを運営している。

 公開年については,全体の約8割のアーカイブが2000年以降の公開であり,うち「2006年以降」が38.5%となっている。収録点数については,半数以上が1,000点未満であり,100点未満のものが27.5%,1万点以上は16.0%である。収録内容では,公共図書館や公文書館で「文献」「図像」,大学図書館で「文献」,博物館で「図像」「物品」「文献」が多いなど,機関種による違いが顕著である。更新頻度は「年に1回程度」(23.6%)が最も多く,月1回以上更新されているものは約2割である。また,8割以上は「ウェブで一般公開」しており,機関内でのみ公開しているものの約2割が将来的なウェブ公開を予定している。

 

(5)デジタルアーカイブ等の実施・運営上の課題

 複数回答可として尋ねたところ,全体では「予算不足」(79.1%)と「人員不足」(79.0%)が圧倒的に多く,以下「データの保守・メンテナンス」(49.6%),「著作権」(48.9%),「データの標準化」(31.7%)と続いている。実施・運営していない理由と同様,予算と人員が2大課題という結果となっている。

 

2 第2次調査結果の概要

 

(1)デジタルアーカイブ等の運営の目的

 デジタルアーカイブ等運営の目的を1位から3位まで順位づけしてもらったところ,全体では1位に「活動成果の普及・公開」をあげた機関が47.8%と半数近くに上り,「資料の継続的保存・管理」(23.7%)がそれに続いている。2位では「資料の検索性の向上」,3位では「広報活動」がそれぞれ多くあがっている。ただし,全体の傾向には回答機関の4割を占める大学図書館の傾向が反映されており,目的の1位として,公共図書館と博物館は「資料の継続的保存・管理」を,公文書館は「資料の検索性の向上」を,大学図書館は「活動成果の普及・公開」をあげており,機関の種類による違いが大きくなっている。

 収蔵品・蔵書のデジタルアーカイブ等への収録率については,「10%未満」が27.1%を占め,50%以上を収録している機関は14.3%,うち「100%」と回答した機関は3.9%である。なお,この設問では「わからない」が47.8%と半数近くを占めるが,第2次調査では多くの設問で「わからない」の回答率が高く,特に利用状況,技術,予算に関する設問において「わからない」とする回答が多くなっている。

 

(2)デジタルアーカイブ等の運営予算

 デジタルアーカイブ等の運営予算が年間予算に占める割合については,「わからない」が44.3%と最も多くなっており,回答があったものでは「0%」が23.4%,「1%未満」が13.9%,「5%以上」は4.4%と,多くの機関は運営のための特別な予算を持っていないか,持っていても全体予算に占める割合は微少である。(内部職員の人件費を除く)運営予算に外部委託費が占める割合についても「わからない」が34.1%と最も多く,それ以外では「0%」が32.9%,「100%」が10.4%となっている。自由記述からは,多くの機関において予算が縮減傾向にあり,職員が通常業務の範囲内でやるか,もしくは外部資金の導入に努めている状況がうかがえる。

 

(3)デジタルアーカイブ等の運営に携わる人材(複数回答)

 デジタルアーカイブ等の運営の担当者については「知識の比較的少ない職員」(37.6%),「知識の比較的多い職員」(35.5%)と,新たなスタッフや部外のアドバイザーを確保することなく,既存の職員が担当している機関が多い。担当者の知識や経験には「撮影から編集,ウェブへの掲載までできる」から「基本的なコンピュータ操作ができる」まで非常に幅がある。人材育成については「セミナーや講習会等に派遣」が30.4%となっているほか,「その他」(44.3%)として独学も含め特に何もしていないと回答している機関が多い。自由記述からは,予算や待遇面での制約から高い専門性を持った人員の増員・育成ができず,知識や技能の習得は担当者の資質や努力に任されている状況がうかがえる。

 

(4)デジタルアーカイブ等に関する権利処理(複数回答)

 著作権等の権利処理方法については,「自らの部署で権利保有者から許諾」(52.4%)が圧倒的に多く,「著作権フリー資料のみデジタル化」(30.2%)がそれに続いている。自機関の権利処理件数や費用の把握状況については,約3分の1(33.9%)の機関が「把握している」と回答しているが,件数では「0件」(26.7%)から「100件以上」(24.0%)までばらつきがあるのに対して,費用では「0円」が7割(72.6%)を占めている。大学図書館では紀要等への論文掲載時に許諾に関する規定を設けている機関が少なくないが,それ以外は著作権処理が必要なものは扱わないとする機関が多い。

 今後権利処理に求めるものとしては,半数以上(51.5%)が「公的マニュアルの整備」をあげ,以下「権利問題処理を扱う公的機関」(35.3%),「公的な権利問題情報データベース」(33.9%)が続いており,権利処理に際しての「公的」な支援が求められているといえる。

 

(5)デジタルアーカイブ等の運営における他機関との連携

 約3割(31.3%)が「連携している」という結果となっているが,国立大学図書館(67.2%),政令指定都市の公共図書館(60.0%),政府関連機関の専門図書館(46.2%)の連携率が高いなど,機関の種類による違いが大きい。大学図書館では国立情報学研究所(NII)のJAIRO等の学術ポータルや共同リポジトリとの連携等をあげる機関が多いが,それ以外の回答機関の多くは情報交換等により将来的な連携を模索している段階である。

 

(6)デジタルアーカイブ等の概要

 第1次調査で回答があったアーカイブのうち,(1) テキストのみの書誌データベース,(2) ウェブ用のプレゼンテーション画像やゲーム類,(3) 当該機関が制作に関与していない市販のデータベース を対象外としたところ,計612件のアーカイブについての回答が得られた。

 コンテンツの総容量については「わからない」が44.4%と最も多く,回答があったものでは「1GB未満」(14.7%),「1GB以上10GB未満」(12.3%)と,比較的小さいものが多い。年間のコンテンツの増加件数は「わからない」が27.9%と最も多くなっているが,それ以外では50件未満が23.7%であるのに対して,100件以上が22.6%,うち1,000件以上が11.3%とばらつきがある。「0件」は16.8%で,増加件数の回答があったアーカイブの4分の1を占めている。

 

(7)デジタルアーカイブ等の利用状況

 ウェブによるアクセス数については,「わからない」が50.0%と半数を占めており,件数の回答があったアーカイブの約6割が月平均1,000件以上であった。アクセス数の増減については「増加傾向」とするものが圧倒的に多く,次が「横ばい」で,「減少傾向」とするものはわずかである。館内端末等ウェブ以外での利用者数は回答アーカイブの7割以上で把握されていない。一般公開されているものの大半は無料で利用でき,一部有料のものについては,複写やプリントアウト,配信や出版物への掲載時に課金される。

 

(8)デジタルアーカイブ等の構築時の状況

 システムの開発については「独自に開発」(32.5%)と「パッケージ利用」(31.4%)が拮抗している。構築予算については「わからない」が28.8%と最も多いが,それ以外では「0円」(15.5%),「1~100万円」(17.5%),「101~300万円」(10.6%)と低額のものが多く,1,000万円以上のものは12.9%である。また,公共図書館や公文書館で「0円」の回答率が高いなど機関種による違いが見られる。予算の出所は「自前の予算」(57.7%)が圧倒的に多く,次が「国の補助金」(19.0%)となっている。構築業務の担い手は「内部の人材」(35.8%)が最も多く,以下「ほとんど外部委託」(32.0%),「一部外部委託」(25.2%)となっている。委託内容は,システム設計,プログラミング,ホームページの立ち上げ等である。コンテンツ作成費については「わからない」が35.1%と最も多く,以下「0円」(22.1%),「201万円以上」(15.7%)と続いている。構築予算,コンテンツ作成費とも「0円」の理由は,「職員が既存の機材等を使って行った」「他の経費に含まれていた」というものが多い。

 

(9)デジタルアーカイブ等の運営状況

 年間運営予算については「0円」(29.7%)が最も多く,次に「1~100万円」(24.7%)となっている。特に公共図書館や公文書館で「0円」の割合が大きい。「0円」の理由は,「通常業務の一環としてやっている」「他部署が管理している」「内容を更新していない」等である。予算の出所は「自前の予算」(52.8%)が圧倒的に多く,次に「国の補助金」(8.5%)となっている。運営業務の担い手は「内部の人材」(59.8%)が最も多く,以下「一部外部委託」(24.3%),「ほとんど外部委託」(8.2%)と続いている。委託内容は,サーバ管理,データ入力,資料の電子化(写真撮影,スキャニング,PDF化等),コンテンツの作成(画像編集等),ウェブページの更新などである。

 

(10)デジタルアーカイブ等の技術

 デジタルアーカイブ等に必要な技術に関して,参考文献があると回答した機関は約1割で,具体的には『国立国会図書館資料デジタル化の手引き』のほか,『デジタルアーカイブ白書』等の概論書,使用ソフトウェア等に関する市販マニュアル類,システムの運用指針などがあげられている。

 メタデータの作成者は,学芸員や司書,教員などが多い。メタデータの準拠フォーマットについては,「わからない」が47.2%と半数近くを占めている。「ある」と回答したものは約2割で,フォーマット名としては,ダブリンコア(DC,OAI_DC等)が最も多く,次にJunii2,そのほかMODS,EAD等があげられている。

 デジタルコンテンツの利用・提供用フォーマットについては,画像系では対象アーカイブの85.9%について回答があり,フォーマット名ではJPEGが最も多く,次いでPDF,以下TIFF,GIFとなっている。PDFは公文書館と大学図書館,JPEGは博物館での使用率が高い。画像系以外については,映像系が8.3%,音声系が3.6%,その他が6.2%と回答率が低く,現在運営されているデジタルアーカイブ等のコンテンツは画像系データが中心であるといえる。保存用フォーマットについては全般に回答率が低く,画像系でも4割弱であり,利用・提供用とは別に保存用ファイルを作成しているものは少ないと思われる。

 記録媒体については「ハードディスク」(70.1%)が最も多く,以下「CD-ROM」(41.0%),「DVD」(31.7%)となっている。長期保存のための取組についての自由記述では,定期的バックアップ,複数媒体への保存のほか,複数コピーの分散保存,新媒体への移行の備え,空調等の保管環境の整備,アナログデータの保管などがあげられている。

 

(11)システム間連携

 外部インターフェイスを利用しているアーカイブは16.0%で,大学図書館が運営するものがそのうち8割以上を占めている。また,外部インターフェイスを利用しているアーカイブの約9割が「OAI-PMH」を利用している。

 国立国会図書館(NDL)のPORTAと連携しているアーカイブは10.0%,PORTA以外のシステムと連携しているアーカイブは17.2%であり,後者については大学図書館が運営するものが7割以上を占めているところから,連携先としてNIIのJAIROやCiNii,OCLCのWorldCat,NDLのDNaviなどが多くあげられている。

 

3 調査結果のまとめ

 今回調査の対象とした文化・学術機関やそれらの提供するデジタルアーカイブ等には,規模,性格,扱う資料やサービスの対象等にかなりの幅があり,一様に評価することはできないが,多くの機関においてデジタルアーカイブ等は基幹的事業ではなく,資金面や人員面でのバックアップ体制が十分でないなかで,担当者がそれぞれに工夫して構築・運営に取り組んでいる状況がうかがえる。外部資金の導入等により特別な予算を確保して構築・運営されている本格的なシステムがある一方,既存の予算の範囲内で通常業務の延長線上に構築・運営されている簡易なものも多数存在する。いずれにおいても,活動成果の普及や資料の保存管理,利用促進等において相応の効果があった点を多くの機関が評価している。そのほか,文化・学術機関内でデジタルアーカイブ等の運営を担当しているのは主に一般の職員であり,技術的な専門性が要求される場面で情報担当部門や外部業者を活用しているケースが多いことも明らかになった。また,人材育成や著作権処理について積極的な取組みをしている機関は少なく,機関のシステム連携,データの長期保存についても一部の機関を除き今後の課題であるといえよう。

 第2次調査では「わからない」の回答率が極めて高く,デジタルアーカイブ等の所要経費や利用状況,採用技術について数量的に十分把握できたとは言い難いものの,個別事例に関しては運営上の課題や工夫点に関する自由記述も含めて,類似他機関が今後デジタルアーカイブ等の構築・運営を考える際に参考となる有用な情報が得られたものと考える。本調査研究の調査結果のマスターデータ,機関種別集計及び公開に同意いただいた機関の詳細については,国立国会図書館のウェブサイト「カレントアウェアネス・ポータル」1)で公開予定である。

 

参考

1) “カレントアウェアネス・ポータル”. 国立国会図書館. http://current.ndl.go.jp/.