E2500 - SPNが公開したソフトウェアのメタデータに関するガイド

カレントアウェアネス-E

No.436 2022.06.09

 

 E2500

SPNが公開したソフトウェアのメタデータに関するガイド

電子情報部電子情報企画課次世代システム開発研究室・木下貴文(きのしたたかふみ)

 

  2022年2月,Software Preservation Network(SPN)は,SPNが推奨する,ソフトウェアの記述に関するメタデータ項目を要約・定義した,“Software Metadata Recommended Format Guide”のバージョン1.0.0(以下「本ガイド」)を公開した。

  SPNは,米国を中心とした,ソフトウェアの保存に関する団体である。ライセンス等の法的な側面から,メタデータの管理や記述に関する側面,エミュレーション等を用いた保存といった技術的な側面に関する取組まで幅広く活動を行っている。米・イェール大学図書館が主導するソフトウェアの動作環境維持のためのプロジェクトであるEmulation-as-a-Service Infrastructure(EaaSI)への協力でも知られている。

●本ガイドの意義

  ソフトウェアのメタデータ記述方法の提案としては,これまでにも,CodeMetaプロジェクト等が知られている。その他,英国国立公文書館(TNA)がファイルフォーマットとソフトウェアのデータベースPRONOMを公開しており,そこに記載されている項目名等を参考にメタデータを記述することも可能である。しかし,前者は研究データの公開を背景としており,後者はファイルフォーマットとの関連付けを重視しているなど,想定する用途が異なる。また,メタデータの記述方法の提案資料は項目の羅列のような体裁となっていることが多く,それぞれの特性が一見ではわかりにくい。

  本ガイドは,メタデータフォーマットとしてはコンパクトであり,異なる文脈で提案された項目との関連付けもなされている。そのため,比較的容易に読み解くことができる。

  以下,構成に沿って本ガイドの内容を紹介する。

●イントロダクション

  本ガイドは,図書館,文書館,博物館,機関リポジトリ等に関する業務に従事する者が,ソフトウェアについて記述する際に利用することを想定している。広くソフトウェア全般を対象としており,商用ソフトウェア等大規模なものから,研究データを解析するために作成した比較的小規模なものに至るまでをカバーしている。これらソフトウェアの発見,アクセス,再利用に必要な技術的・記述的なメタデータ項目を特定することが本ガイドの目標であるとしている。

  ただし,本ガイドが提供するのは,おおよその枠組のみであり,厳密にスキーマ等の仕様を定めている訳ではない。そのため,利用者の特殊なニーズによっては,別のメタデータフォーマット等を参照した項目が必要となるうえ,実際の運用にあたっては利用者の裁量で判断すべき点も多いことに注意が必要であるとされている。

●ガイド本編

1. メタデータ項目

  5つのセクションに分けてメタデータ項目を列挙している。各メタデータ項目に,名前,必須性(その項目が必須か,推奨か,任意か等),定義,留意点,例が付されている。各セクションの内容は次の通りである。

  • 基本情報
      タイトル,説明,日付,ジャンル,識別子,バージョン,付属資料というソフトウェア本体に対する基本的な7項目を挙げている。識別子の例としては,DOIやPUID(PRONOMのID),WikidataのID等が挙げられている。
  • 配布形態
      配布のフォーマット,ダウンロードURL,ライセンス,配布方式等あわせて9項目が挙げられている。一般に,ソフトウェアはライセンスにより利用に制限がかかっているケースが多いため,これらの情報の取得は重要である。
  • 責任表示
      ソフトウェアの責任表示に関する7項目が挙げられている。作成者,プログラマ,管理者,発行者,著作権者等ソフトウェア特有の関与の仕方に合わせた項目が立てられている。
  • 動作環境
      ソフトウェアには特定の動作環境(OS,システムライブラリ,ハードウェア,ランタイム環境等)があり,それ以外では動作が保証されない。それらの情報を記録するための6項目が挙げられている。
  • 使用言語
      開発に用いたプログラミング言語と,設定やインターフェース等で用いられる言語(英語,フランス語等)の2項目が挙げられている。

2. 本ガイドの適用例

  フロッピーディスクに記録されたシェアウェア,研究で作成したプログラム,市場で広く流通したソフトウェア,メディアアートの4例について,上記の項目で記述した例が挙がっている。

3. 他フォーマットとの対応表

  本ガイドの提案する項目と,汎用的なメタデータフォーマット(MARC, Dublin Core, MODS)や,ソフトウェアのメタデータ項目としてこれまでに使用された他の例(CodeMetaプロジェクト,Wikidataのプロパティ)の提案項目との対応表(crosswalk)が用意されている。

●今後の活用に向けて

  前述の通り,メタデータフォーマットに関する提案は項目の羅列になりやすく,全体として学習のハードルが高い。本ガイドは,例も豊富で平易であり,初学者用の手引としての活用が期待できると考える。

Ref:
“Software Metadata Recommended Format Guide (SMRF)”. SPN.
https://www.softwarepreservationnetwork.org/smrf-guide/
The CodeMeta Project.
https://codemeta.github.io/
“PRONOM”. The National Archive.
https://www.nationalarchives.gov.uk/PRONOM/