E2519 – 長期保存を視野に入れた学術資料の出版ガイドライン(米国)

カレントアウェアネス-E

No.439 2022.07.21

 

 E2519

長期保存を視野に入れた学術資料の出版ガイドライン(米国)

関西館電子図書館課・水流添真紀(つるぞえまき)

 

  2022年1月,米・ニューヨーク大学図書館(NYU図書館)が,デジタル形式の学術情報を長期保存可能な形で出版するためのガイドライン“Guidelines for Preserving New Forms of Scholarship”(以下「ガイドライン」)を公開したと発表した。作成の背景には,研究者が多様なデジタル形式で研究成果を発表するようになっていること,また,出版者が多様なデジタル形式に対応しながら,長期的な保存を実現するという課題に直面していることがあると述べられている。

  ガイドラインは,アンドリュー・W・メロン財団の資金提供のもと,NYU図書館を中心としたデジタル資料の保存機関,図書館,大学出版局等のグループが作成した成果物である。米・ミシガン大学のMichigan Publishing,ミネソタ大学出版局等の大学出版局,電子ジャーナルのアーカイブプロジェクトCLOCKSS,電子学術情報アーカイブPortico等の電子情報の保存サービスに関わる組織が参加している。

  想定読者はデジタル出版物を作成する出版者であるが,著者及び編者,デジタル出版物の作成スタッフ,ソフトウェア開発者,出版プラットフォームの関係者とも広く共有することが意図されている。

  ガイドラインは9つのキーワードと68の推奨事項からなり,より長期保存に適した出版物にするための様々なアプローチが提示されている。また,推奨事項にはそれぞれ一つ以上のキーワードがタグ付けされている。HTML,PDF,EPUBの3つの形式で公開されているが,そのうちHTML版では,キーワードをクリックすると,当該キーワードがタグ付けされた推奨事項のみを一覧できる。

  作成プロジェクトの詳細については,2021年12月に公開された“Report on Enhancing Services to Preserve New Forms of Scholarship”に記載されている。なお,ガイドラインは2022年2月に修正版が公開された。

●キーワード

  9つのキーワードとは,「埋込みリソース」「出力パッケージ」「EPUB」「計画」「出版プラットフォーム」「権利」「ソフトウェア及びデータ」「外部サービスやプラットフォームへの依存関係」「ウェブベースの出版物」である。いくつか補足すると,「埋込みリソース」は出版物に埋め込まれた画像や音声等の非テキストデータ,「出力パッケージ」は出版物を保存サービスに移行するために作成されたデータのまとまり,「出版プラットフォーム」は出版物を提供及び管理するためのソフトウェア,「ウェブベースの出版物」は,ダウンロードを前提とするPDFやEPUBとは異なり,ウェブサイトに直接表示するようにデザインされた出版物を指す。

●推奨事項

  ここでは,推奨事項の中から興味深いものを取り上げたい。(( )内は推奨事項の番号)

  特徴的な点の一つは,既存の標準等の使用を推奨していることである。例えば,書誌データではONIXやダブリンコア,フルテキストにはTEIやEPUB,引用形式ではMLAやBibTeXが例示されている(3)。また,ファイルフォーマットについては,十分なサポートがあるオープンなフォーマットの使用を推奨すると同時に,米国議会図書館(LC)による長期保存のための推奨フォーマットのガイド“Recommended Formats Statement”を紹介している(11)。

  長期利用を保証するため,変更履歴やコンテクストを記録しておく必要性について述べている項目も多い(6,9,10,16,26,40,64,66,68)。

  ウェブベースの出版物については,サイトマップを記述したファイルを含める(43),リンクを簡潔にする(44),URLが長期間変化しないようにする(47),ウェブクローラーがアクセスしやすいリンク構造にする(52)など,ウェブアーカイブを視野に入れ,クローラーによる収集をスムーズに行うための推奨事項が多い。

  なお,ガイドラインでは,キーワードに「EPUB」が設定されているが,日本国内の学術出版物で最も使用されているPDF(CA2004参照)は設定されておらず,推奨事項でも触れられていない。とはいえ,EPUBに関する記述をPDFに読み替えることは可能であろう。例えば,非テキストのオブジェクトにはキャプションを付与する(16),文字エンコーディングを埋め込む(28),保存に特化した形式を検討する(29),暗号なしのバージョンを保存機関に提供する(32)等は,PDFにも適用できる。

●おわりに

  日本国内の代表的な学術出版プラットフォームとしては,学術機関リポジトリデータベース(IRDB),科学技術情報発信・流通総合システム(J-STAGE)があり,国立国会図書館でも収集した電子出版物を国立国会図書館デジタルコレクションで提供している。また,各大学でリポジトリが構築されるなど,多くの機関で学術情報が日々作成・公開されている。さらに今後,研究データの収集及び公開が進展すると,各プラットフォームでも,多様なデータ形式への対応が必要となることが想定される。

  ガイドラインは,プラットフォームを提供する学術機関に限らず,論文等を作成,公開する者にとっても広く参考になるといえるだろう。

Ref:
“NYU Division of Libraries Issues First-ever Guidelines For Publishing Preservable, Complex Digital Scholarship”. NYU Libraries. 2022-01-26.
https://guides.nyu.edu/blog/NYU-Libraries-DLTS-Issues-First-ever-Guidelines-For-Publishing-Preservable-Complex-Digital-Scho
Guidelines for Preserving New Forms of Scholarship.
https://preservingnewforms.dlib.nyu.edu/guidelines
Greenberg, J.; Hanson, K.; Verhoff, D. Guidelines for Preserving New Forms of Scholarship. NYU Libraries, 2021, 28p.
https://doi.org/10.33682/221c-b2xj
Greenberg, J.; Hanson, K.; Verhoff, D. Report on Enhancing Services to Preserve New Forms of Scholarship. NYU Libraries, 2021, 46p.
https://doi.org/10.33682/0dvh-dvr2
“Recommended Formats Statement”. LC.
https://www.loc.gov/preservation/resources/rfs/
安形輝, 宮田洋輔, 池内淳. 日本の機関リポジトリにおけるPDFファイルの長期保存とアクセシビリティ. カレントアウェアネス. 2021, (349), CA2004, p. 9-11.
https://doi.org/10.11501/11727158