E2094 – Omeka Sを活用した東京大学文書館デジタル・アーカイブの公開

カレントアウェアネス-E

No.361 2019.01.17

 

 E2094

Omeka Sを活用した東京大学文書館デジタル・アーカイブの公開

 

    東京大学文書館は,2018年8月にデジタル・アーカイブを公開した。東京大学文書館が保有する資料(特定歴史公文書等や東京大学に関連する歴史資料)の目録データ・画像データをオンライン上で公開し,効率的な目録検索と画像データ閲覧の手段を提供するとともに,他組織のデジタル・アーカイブとも連携可能にすることが開発の目的であった。それまで東京大学文書館は,HTMLの表とPDFの静的データとして,目録情報をウェブ上に公開しており,標準的な規格にしたがったデータ提供が実現できていないことを改善する必要があった。

    デジタル資産公開の仕組みの開発は,東京大学内を通じて課題とされており,文書館,総合図書館,大学院情報学環の若手研究者を中心に,2015年頃から研究会を通じて国内外における状況の調査,技術的な方法論,利活用の可能性について議論をおこなっていた。この議論の一環として,セマンティック・ウェブ技術を用いて,現在進行形で変化する大学組織の資料群の構造を記述するためのシステムの可能性を考察した。一方で,こうした利活用の可能性を重視するアプローチと並んで,限られた予算と資源において情報をいかに持続的に発信しつづけるかという課題もあった。背景として,継続的な運用が困難になり停止せざるを得なくなった先行のデジタル・アーカイブが少なくないという問題があった。

    東京大学文書館では,現実的な解決策として,学内の情報基盤センターが提供するウェブ・ホスティング・サービスで提供されるLAMP(Linux,Apache,MySQL,PHP)環境上に軽量のシステムを構築することとした。継続的な開発のために,すべてを独自システムとして開発(スクラッチ開発)するのではなく,すでに活発なコミュニティが形成されているオープンソースのオンライン展示用システムとして定評のあるOmekaを採用した。閲覧者用のユーザ・インターフェイスについては,東京大学文書館の目録表示に最適なものをアジャイルに開発するためWordPressを利用した。実際の開発は情報基盤センターの中村覚氏の協力を得て進め,2017年10月にデジタル・アーカイブのベータ版を公開した。

    2017年11月に,組織向けのシステムとしてOmeka Sが正式公開されたことを受けて,デジタル・アーカイブの本公開版に採用することとした。Omeka Sの機能拡張として,資料の階層関係の可視化,旧字・異体字の同時検索,国立公文書館など外部のデジタル・アーカイブとの連携(SRU/SRW対応)のためのモジュールを開発した。また,外部システムがデータを活用しやすいように,目録データはEADやDublin Coreなど標準的なメタデータの語彙に可能なかぎりマッピングしたうえで,JSON-LDやRDF/XMLなど複数の形式で取得できるようにしている。このデジタル・アーカイブは,利用する学内のホスティング・サービスに依存した,永続性に不安の残るURLで当初は公開していたが,2018年12月25日より東京大学公式ドメインのサブドメインでの公開が実現した。

    このデジタル・アーカイブ上では,東京大学文書館が公開する全目録のキーワード検索が可能となっており,デジタル画像を持つ資料についてはその閲覧もできる。現在,画像データとして公開しているのは,国の重要文化財指定を受けている公文書綴り『文部省往復』(東京大学文書館:S0001)の明治期分である。戦前期の文部省資料が失われている状況において,近代日本の高等教育政策史研究上の貴重な資料となっている。大正期分については2019年中にデジタル公開予定であり,昭和戦前期分についても準備を進めている。この他に,デジタル画像公開の準備を進めているものとして,矢内原忠雄による学生問題研究所関連の資料,1968年から1969年の大学紛争に関連する資料がある。これら,学生問題・学生運動関連の資料のデジタル画像を公開することで,1950年代から1960年代を通じた大学当局と学生の関係を多面的に解明する可能性が開けると考えている。

    今後の課題として,画像の活用の幅を広げるためにIIIF(E1989参照)へ十分に対応することが望ましい。サーバ・マシンの制約により,IIIF画像サービス非対応の単純なJPEG画像を利用しているため,提供するIIIFマニフェストを一部のビューアでは読み込めない場合がある。また,メタデータの活用には,LOD(Linked Open Data)化のため,RDFトリプルを格納するRDFストアを構築することが有効であろう。さらに,長期的な目録情報提供のためには,公開用システムに依存しない構造化された静的データを用意しておくことが安定的であると考えるが,これはまもなく提供開始する予定である。それらのデータにはDOIを付与することが望ましいが,これも課題となっている。

   開発したモジュールは,オープンなライセンスを付与してウェブ上に公開する予定である。学内他部局や学外組織も利用できるようにすることは,デジタル・アーカイブ公開の敷居を下げ,また日本におけるOmekaコミュニティへの貢献につながると期待している。

東京大学文書館・宮本隆史

Ref:
https://uta.u-tokyo.ac.jp/uta/s/da/
http://hdl.handle.net/2261/72519
https://www.u-tokyo.ac.jp/content/400045512.pdf
https://www.u-tokyo.ac.jp/content/400061599.pdf
http://www.center.iii.u-tokyo.ac.jp/wp-content/uploads/27_1.pdf
http://www2.archives.tohoku.ac.jp/news/TUANL29.pdf
https://omeka.org/
https://www.u-tokyo.ac.jp/content/400069419.pdf
https://omeka.org/s/
https://www.u-tokyo.ac.jp/content/400077652.pdf
E1989

 

 

クリエイティブ・コモンズ 表示 4.0 国際

※本著作(E2094)はクリエイティブ・コモンズ 表示 4.0 国際 パブリック・ライセンスの下に提供されています。ライセンスの内容を知りたい方はhttps://creativecommons.org/licenses/by/4.0/legalcode.jaでご確認ください。