E1700 - 「全国遺跡報告総覧」の機能と期待される効果

カレントアウェアネス-E

No.287 2015.08.27

 

 E1700

「全国遺跡報告総覧」の機能と期待される効果

 

1.はじめに

 全国で毎年約8,000件の遺跡が発掘され,その成果は発掘調査報告書にまとめられる。報告書は年間約2,000冊発行され,これまで膨大な成果が蓄積されている。しかし,報告書の流通範囲は限られることから,いわゆる「灰色文献」化しており,実際に成果に触れる機会が限定される。そこで2015年6月,発掘調査報告書を全文電子化しインターネット上で検索・閲覧できるようにした「全国遺跡報告総覧」を奈良文化財研究所(以下奈文研)にて公開した。本稿では,そのシステム構成や機能,期待される効果を紹介する。

2.奈良文化財研究所へのシステム・データ統合の経緯

 2008年度から2012年度にかけ,国立情報学研究所の最先端学術情報基盤(CSI)整備事業の委託を受けて,島根大学を中心とした全国の21の国立大学が連携して取り組んだ「全国遺跡資料リポジトリ・プロジェクト」(以下遺跡リポジトリプロジェクト)では約1万4,000冊の発掘調査報告書が電子化され,年間約50万件のダウンロードがあるなど,活発に利用され大きな成果をあげた。しかし,CSI事業の終了やサーバの老朽化など,プロジェクトの継続に課題があった。そこで,奈文研では,発掘調査報告書のメタデータを提供していて,また遺跡リポジトリプロジェクトで共同研究してきた経緯もあって,各大学の遺跡リポジトリシステムと報告書の電子データを統合し,移管することとした。当面,従来通り各大学がデータ登録を担い,情報基盤の維持管理を奈文研が担当する予定である。また,大学だけでなく自治体も発掘調査報告書を作成しているが,これまで共通の公開の場がなかった。本システムを共通の公開の場として環境整備し,将来的に全国の自治体にも参加を呼びかけ,担当者の方に直接データを登録してもらうことを目標としている。

3.システム構成

 各大学がシステムを管理し,サーバを分散配置した場合,それぞれに運用・維持管理コストがかかる上,全国のデータを一括検索できないなどデメリットがある。そのため奈文研によるシステム・データの集中管理によって,運用の効率化を目指した。しかし,システムの統合は,(1)システムへの負荷集中,(2)ネットワークトラフィックの増大,(3)年々増加するデータ量,などの課題が予見されたため,柔軟にシステム構成を増強できるクラウドプラットフォームを採用した。

4.システムの機能

 メタデータ及び報告書本文を対象とした簡易検索(キーワード検索)によって登録されているすべての発掘調査報告書の電子データを1度に検索することが可能である。検索結果画面に文章を表示し,該当キーワードをマーカー表示することで,ユーザが必要としている報告書かどうか文脈で判断できるようにした。報告書はダウンロードして閲覧可能である。またNACSIS-CATの書誌ID(NCID)をメタデータに設定しているため,CiNii Booksを参照して当該報告書の所蔵機関を調べることも可能である。

5.期待される効果
(1)可視性の向上

 発掘調査報告書には,それぞれOCR処理を施しているため,任意のキーワードで全文検索できる。今までは各大学にデータが分散していたため,個別に検索する必要があったが,本システムでは1度の検索で全国の報告書全文を検索できる。考古学は過去の事例を蓄積し,分析・研究を行う学問であり,過去の事例把握が重要である。本システムによって漏れなく効率的に類例・前例を調査できるようになった意義は大きい。

(2)容易な情報入手

 従来,入手や閲覧が困難だった発掘調査報告書がウェブ上で閲覧可能となり,情報入手が容易となった。研究者はもちろん,一般の方も報告書を通して新たな歴史的認識を得ることができる。地域学習や調査成果の社会への還元に貢献するであろう。

(3)新たな研究領域の創出

 考古学に関する膨大な電子データを集約した。2015年5月末時点のデータ量は,報告書等1万4,333冊,総ページ数165万6,413,総文字数6億1,521万143である。考古学ではこの規模の情報量を集約した例はない。考古学に関するコーパスの自動構築や計量テキスト分析による新たな研究領域の発展につながり,考古学研究の高次化・効率化に貢献できる情報基盤となる可能性がある。

(4)災害対策

 本システムは,クラウドプラットフォームであるため,データ増加に合わせ柔軟にシステムの増強が可能である。また,サーバ本体を特定拠点に設置し,その地域が激甚災害に見舞われた場合には,データの保全や業務継続の観点から大きなリスクが発生する。クラウドプラットフォームを採用し,複数のデータセンターにデータを保管することによって,データ保全における災害対策となり,業務継続性を向上させることができる。

6.おわりに

 本システムは,「灰色文献」とされる発掘調査報告書の可視性の向上に貢献し,情報入手を容易にして,かつ新たな研究領域の創出につなげることができるものと考えている。課題は多いが,発掘調査報告書のプラットフォームとなることを目指して機能改善を進めていく予定である。まずは気軽に使っていただき,ご要望を寄せていただければ幸いである。

奈良文化財研究所・高田祐一

Ref:
http://sitereports.nabunken.go.jp/ja
http://repository.nabunken.go.jp/dspace/handle/11177/3428
http://repository.nabunken.go.jp/dspace/handle/11177/3430
http://drf.lib.hokudai.ac.jp/drf/index.php?plugin=attach&refer=%E6%9C%88%E5%88%8ADRF&openfile=DRFmonthly_67.pdf