E2645 – アーカイブズ統合検索ネットワーク(NAFAN)構築の取組

カレントアウェアネス-E

No.468 2023.11.16

 

 E2645

アーカイブズ統合検索ネットワーク(NAFAN)構築の取組

東京大学文書館・元ナミ(うぉんなみ)

 

  2023年5月、OCLCは“Building a National Archival Finding Aid Network”(NAFAN)に関する調査報告書を公開した。本稿ではNAFANの取組と報告書の概要を紹介する。

●NAFANとは

  NAFANは、米・カリフォルニア電子図書館(CDL)が主導する2020年9月から2023年2月まで2年半の研究・実証プロジェクトであり、米国博物館・図書館サービス機構(IMLS)が支援してきた。その目的は、より広範な文化遺産機関の参加を可能とする、全米におけるアーカイブズ検索手段のネットワークを確立することである。様々なエンドユーザーのニーズを満たすため、複数の機関のコレクションに関するデータを包括的、総合的、永続的に集約・提供するアグリゲーションの実現に向けた課題に取り組んでいる。パートナーとしてOCLC、米・バージニア大学図書館などが参加し、米国の図書館などのネットワークであるLYRASISとも緊密に連携している。

●調査の背景

  アーカイブズアグリゲーションは、インフラが老朽化し、予算が減少するにつれ、システムが孤立することが発生しうる。それによりアーカイブズ検索手段の情報が更新または連携されなくなると、ユーザーは複数の検索システムを利用する手間が増えて、資料を発見し識別するための負担が増えてしまう。その結果、多くの歴史的記録としての資料が容易に検索できなくなる。こうした背景の下、本調査では、アーカイブズアグリゲーションに関わる全てのユーザーが直面する課題を解決するために、文献調査、エンドユーザー及びアーキビストを対象としたインタビュー、構造化されたアーカイブズ記述(Encoded Archival Description:EAD)のデータの定量分析を行った上で、それらを相互に関連付けながらの分析が行われた。

●報告書の概要

  公開された報告書は5件あり、その概要は以下のとおりである。

  1. 調査概要
      同プロジェクトの調査活動から得られた知見をまとめた。
  2. ポップアップ調査
      地域を基盤とする12のアーカイブズアグリゲータのウェブサイト上でアンケートを実施し、エンドユーザーから合計3,352の有効回答を得た。オンラインで資料を利用するエンドユーザーの検索行動、情報ニーズ、人口統計学的特性に関する全国的な調査を行った。
  3. ユーザーインタビュー
      アーカイブズアグリゲーションのエンドユーザーの情報ニーズや情報検索行動に関する調査のために、16の異なる州に住んでいる25人のエンドユーザーに、半構造化された個別インタビューを行った。
  4. フォーカスグループインタビュー
      異なるアーカイブズ機関・組織に所属する53人のアーキビスト(フォーカスグループ)へのインタビューから、アーカイブズのコレクション記述やアーカイブズアグリゲーションへの記述に貢献している人々のニーズを調査した。
  5. EAD分析
      計741リポジトリの14万5,000以上のEAD/XMLファイルから構成されるデータセットを用いて、EADの共通のデータ構造を探し、エンドユーザーからの発見を妨げる可能性がある要因などを定量分析した。

●今後の課題

  これらの調査結果から見えてきた、将来のNAFANプロジェクトのために取り組むべき価値のある提案として、以下の4つが挙げられている。

  • ウェブサイト上で資料の所蔵状況を可視化し、資料・機関・トピック間のつながりが分かるような仕組みを提供することで、エンドユーザーからの発見されやすさを向上させること。
  • 資料の媒体を問わず、資料へのアクセスのしやすさを確保すること。デジタル化資料に簡単にアクセスできるようにすることや、地理的に近くに保管されており、簡単にアクセスできる可能性が高い資料を発見できる仕組みを提供することなどが含まれる。
  • アグリゲータの要件を満たすEADを用意するための作業の効率化など、アーキビストの作業負担を軽減すること。
  • 様々なアーカイブズ機関、エンドユーザーが等しく利用できる資料へのアクセス環境などが十分に整備されておらず、歴史的記録、学術、知識へのアクセスと普及に影響を与えている現状を是正していくこと。

  また、本調査により、アーカイブズ側には人的・技術的・資金的なリソース不足の問題があり、より機能的で円滑なサービス提供を求めるエンドユーザーからの期待に応えるためには、コスト負担面を含め、持続可能性に対する潜在的な課題が存在する可能性があることが示された。

●さいごに

  今回のNAFANプロジェクトは、全米に存在するアーカイブズ資料を統合的に検索できるアグリゲータの構築と、それに必要な要件を明確にするために実施された。既存のアグリゲータにEADを提供している多くの参加機関は、米国アーキビスト協会(SAA)のアーカイブズ記述標準(Describing Archives: A Content Standard:DACS)を採択しており、DACSはEADやMARC21に符号化できる。膨大なEADの定量的分析を行なった結果、将来NAFANの構築が実現された場合、DACSの「単一レベル(single level)及び最適水準(optimum)」で記述されているデータが、最も有効に活用できると見込まれた。この結果は、アーカイブズ機関において、アーカイブズ記述標準を導入し、標準形式のメタデータを保有することが、外部システムとの連携に効果的であることを示唆する。

  一方で、EADを含め、従来の記述標準がセマンティックウェブやリンクトデータにも対応できるよう、国際公文書館会議(ICA)の専門家団体により、アーカイブズの新しい記述標準(Records in Contexts:RiC)が開発された。2016年に公開されて以来、安定版が確定するまで更新されている。

  日本ではまだ国立公文書館以外では、EADを作成・提供する機関が少ないのが現状であり、標準のメタデータ形式を採択している機関もほとんどない。今後、日本においても、資料記述の標準化が進むことで、外部システムと連携しやすくなること、さらに、ユーザーがアーカイブズ資料と関連情報を見つけやすくするための取組が進められることを期待する。

Ref:
“Research Findings from the Building a National Finding Aid Network Project ”. OCLC Research. 2023-05.
https://www.oclc.org/research/publications/2023/nafan/nafan-summary-research.html
Building a National Finding Aid Network.
https://ucopedu.atlassian.net/wiki/spaces/NAFAN/overview?homepageId=47742979
California Digital Library.
https://cdlib.org/
“Regents of the University of California”. IMLS.
https://www.imls.gov/grants/awarded/lg-246349-ols-20
Lyrasis.
https://www.lyrasis.org/Pages/Main.aspx
University of Virginia Library.
https://www.library.virginia.edu/
Society of American Archivists.
https://www2.archivists.org/
“Describing Archives: A Content Standard(DACS)”. SAA.
https://www2.archivists.org/groups/technical-subcommittee-on-describing-archives-a-content-standard-dacs/describing-archives-a-content-standard-dacs-second-
“Archival arrangement and description ”. ICA.
https://www.ica.org/en/archival-arrangement-and-description