電子情報保存

米・国家デジタル管理連盟(NDSA)、“Digital Preservation 2020”の記録動画を公開:2020年11月に開催されたデジタル保存に関する会議

2021年1月26日、米・国家デジタル管理連盟(NDSA)は、デジタル保存に関する会議“Digital Preservation 2020: Get Active With Digital Preservation”の記録動画を公開したことを発表しました。

“Digital Preservation 2020”は、NDSAにより2020年11月にオンラインで開催されました。記録動画はNDSAのYouTubeチャンネルで公開されているほか、発表スライドも非営利団体Center for Open Science(COS)の研究プロジェクト管理システム“Open Science Framework”(OSF)上に掲載されています。

Webrecorderプロジェクト、ウェブアーカイブに関する新たなファイルフォーマット“WACZ”のバージョン1.0をリリース

ウェブアーカイブのツール構築に取り組むWebrecorderプロジェクトは、2021年1月18日付けのブログ投稿において、ウェブアーカイブに関する新たなファイルフォーマット“WACZ”(Web Archive Collection Zipped)のバージョン1.0のリリースを発表しています。

WACZは、WARC形式の複数のファイルを、インデックスデータとともにZIP形式で圧縮するパッケージ・フォーマットとして機能します。仕様はGitHub上で公開されており、ファイル拡張子は「.wacz」です。

Webrecorderプロジェクトは、2020年8月12日付けのブログ投稿において、当時開発中であったWACZの解説を行っており、以下の利点等が紹介されています。

・個々のWARCファイルには自身のインデックスデータが含まれていないため、内容を特定するためにファイル全体を読み込む必要がある。一方、WACZではコンテンツのインデックスデータを含むため、インデックスを活用した部分的な読み込みが可能となる。
・WARCはタイトルや説明記述(description)のようなメタデータを保存できる設計となっていないが、WACZではそれらメタデータもまとめてパッケージ化することが可能である。

世界の言語遺産を保存するアーカイブプロジェクト“collection Pangloss”(記事紹介)

2021年1月15日、フランス国立科学研究センター(CNRS)が、消滅の危機に瀕し、記録されていない言語の音声アーカイブプロジェクト“collection Pangloss”に関する記事を掲載しました。

同プロジェクトは、言語多様性等に関するCNRS内の研究ユニット“Langues et civilisations à tradition orale(LACITO)”により1995年から開始され、2012年に“collection Pangloss”という名称がつけられました。

記事によると、現地調査時に収集された170以上の言語の、ドキュメント、音声、ビデオ3,600件以上がコレクションに含まれています。また、提供されている録音は、全体で約780時間であり、半分近くに内容のテキストや注釈が付与されています。

また、記事の中では、専門家のニーズに応えること、より多くの人がアクセスしやすくすることを目的に、2021年1月にインターフェースを改善したウェブサイトを公開したことに触れています。その他、FAIR原則に則ったデータの提供や、2020年10月以降行っているドキュメントへのDOI付与をはじめとした、オープンサイエンスに関する取組等について述べられています。

米国政府印刷局(GPO)の政府情報に関するデータベース“govinfo”、信頼できるデータリポジトリ(ISO 16363)として認証

2021年1月13日、米国政府印刷局(GPO)は、同局が運営する政府情報に関するデータベース“govinfo”が、信頼できるデータリポジトリとして認証を受けたと発表しています。

2段階の審査を経て、デジタルリポジトリに係る審査・認証基準であるISO 16363(Audit and certification of trustworthy digital repositories)の認証を受けたものです。

米・国家デジタル管理連盟(NDSA)、デジタルコンテンツの収集・管理・保存における意思決定を支援するガイド“Digital Curation Decision Guide”の初版を公開

2020年12月18日、米・国家デジタル管理連盟(NDSA)が、デジタルコンテンツの収集・管理・保存における意思決定を支援するガイド“Digital Curation Decision Guide”の初版の公開を発表していました。

NDSAで、デジタル保存の支援ツール“Levels of Digital Preservation”の改訂に携わったワーキンググループが作成したものであり、非営利団体Center for Open Science(COS)の研究プロジェクト管理システム“Open Science Framework”(OSF)のプラットフォーム上で公開されています。

本ガイドの“Introduction”によれば、デジタルコンテンツの取得に携わるキュレーターのために意思決定のポイント等を示したガイドであり、「コレクション構築」「コレクション管理:セキュリティ」「コレクション管理:知的アクセス」「コレクション管理:技術的アクセス」といったテーマを含んでいます。

米国国立公文書館(NARA)、トランプ政権の公式ソーシャルメディアのすべてのコンテンツを収集・保存・提供すると発表

米国国立公文書館(NARA)が、@realdonaldtrumpや@POTUSから削除された投稿を含む、トランプ政権の公式ソーシャルメディアのすべてのコンテンツを収集・保存・提供すると発表しています。

ホワイトハウスでは、大統領記録法に従い、NARAと相談のうえ、全てのコンテンツを収集・保存するアーカイビングツールを使用しており、これらの記録は2021年1月20日にNARAに引き渡され、NARAが新たに公開するウェブサイト“trumplibrary.gov”で公開されます。

@USNatArchives(Twitter,2021/1/11)
https://twitter.com/USNatArchives/status/1348330024420700160

E2345 - 英国の国家プログラム“Towards a National Collection”

本稿で紹介するTowards a National Collection(TaNC)は,英国の世界的に著名な博物館・美術館や文書館,図書館に対し,2020年2月から2025年1月にかけての5年間で1,890万ポンドもの大規模な投資を行う,英国芸術・人文科学研究会議(AHRC)が主導する国家プログラムである。TaNCは,研究者や一般の人々が英国の文化遺産にアクセスする上で障害となっている,オンライン上の異なるコレクション間の隔絶を無くすことを企図しており,統合されたバーチャルな「国家コレクション」の創設に向けた最初の一歩として位置づけられている。そして,これまでにない新しい研究課題の設定を可能としたり,各文化施設の訪問者数を増加させたり,英国の文化遺産へのオンライン上のアクセスを劇的に拡大・多様化させたりするほか,経済や社会、健康への好影響を英国に広くもたらすことが期待されている。さらには,イノベーションを促し,デジタル人文学における英国の世界的リーダーシップを維持し,この分野における世界標準を築くという。

Open Preservation Foundation(OPF)、2020年の事業を振り返るレポート“End of Year Highlights 2020”を発表

2020年12月16日、デジタル資料の長期保存を目指す非営利団体Open Preservation Foundation(OPF)が、2020年にOPFが行った事業を振り返るレポート“End of Year Highlights 2020”を発表しました。

実施した事業として、ウェブサイトのリニューアル、デジタル保存コミュニティを対象としたデジタル保存に関する現状調査の実施と結果公表、OPFの設立10周年を記念したオンライン会議“OPFCON”の開催、デジタル保存のツールをテストできる仮想研究環境“Virtual Research Environment”の開発、メンバーシップ・モデルの変更と新たなメンバー募集パンフレット(英語・日本語を含む6か国語版)の公開等を挙げています。

米国のスミソニアン・ライブラリーとスミソニアン・アーカイブスが統合

2020年12月8日、米国のスミソニアンライブラリー(Smithsonian Libraries)とスミソニアン・アーカイブス(Smithsonian Institution Archives)が統合し、スミソニアン図書館・文書館(Smithsonian Libraries and Archives)となったことが発表されています。

統合は、より広範なデジタル基盤の提供、デジタル保存や研究データ管理の拡大、創造的なプログラム・イベント・展示・インターシップ・フェローシップ・教育資源・資金調達の機会を提供することを目的としています。

スミソニアン協会のミュージアムや研究センター内に位置する21の分館(ワシントン,D.C.、メリーランド州、バージニア州、ニューヨーク市、パナマ共和国)で構成される研究図書館機構として、137人の職員が所属し、15人からなる諮問委員会により運営が支援されることになります。

両館の統合により、同館では、芸術学から動物学までの約300万冊の図書と、同協会の1846年の設立以来のアーカイブ資料を所蔵することとなりました。5万冊の貴重書や手稿が所蔵されているほか、12万点以上の電子書籍・ジャーナル・データベースも利用できます。

E2332 - 消滅するOAジャーナルと長期保存のための取り組み

学術雑誌の購読料の高騰,研究成果の迅速かつ自由な共有の実現,社会への説明責任といったことを背景としてオープンアクセス(OA)が推進されてきており,2000年以降掲載論文を無料でウェブ上に公開するOAジャーナルが広まりを見せている。しかし,OAジャーナルを巡っては論文処理費用(APC)の高騰,捕食ジャーナル(CA1960参照)の興隆といった様々な課題が指摘されている。2020年8月27日付でarXivにて公開された“Open is not forever: a study of vanished open access journals”と題されたプレプリント(以下「プレプリント」)では,OAジャーナルの保存という課題について調査が実施されている。著者はフィンランド・ハンケン経済大学のMikael Laakso氏ら3人である。本稿ではプレプリント(9月3日付公開のVersion 3)に基づき,この課題の調査結果と,OAジャーナルの長期的な保存とアクセスを実現するための取り組みについて報告する。

ページ