メタデータ

複数機関のデジタル化資料を横断検索できるサービス“OpenTexts.World”が公開:約800万点の資料を検索可能

複数機関のデジタル化資料を横断検索できるサービス“OpenTexts.World”の2020年10月5日付けTwitterにおいて、同日にサービスの立ち上げを行ったことが報告されています。

同ウェブサイトの概要紹介ページによれば、「世界中のデジタル化されたテキストコレクションへの無料アクセスを提供する実験的なサービス」です。現在はベータ版としての公開であり、以下のデジタル化資料約800万点が検索対象となっています。

・米・HathiTrustの約443万点
・Internet Archive(IA)によるAmerican Libraries Collectionの約296万点
・ニュージーランド国立図書館によるDigitalNZの約24万点
・英・オックスフォード大学ボドリアン図書館の約23万点
・英・ウェルカム・コレクションの約18万点
・英・ウェールズ国立図書館の2801点
・英・クイーンズ大学ベルファスト校の186点

デジタル化資料のグローバル・データセット作成に関する共同研究プロジェクトGlobal Digitised Dataset Network、最終報告書を公開

2020年10月5日、デジタル化資料のグローバル・データセット作成に関する共同研究プロジェクトGlobal Digitised Dataset Network(GDDNetwork)は、プロジェクトの最終報告書“Towards a Global Dataset of Digitised Texts : Final Report of the Global Digitised Dataset Network”の公開を発表しました。

GDDNetworkは、英国芸術・人文科学研究会議(AHRC)による助成の下、2019年2月から2020年1月にかけて実施されたプロジェクトです。英・グラスゴー大学と米・HathiTrustが主導し、英国図書館・スコットランド国立図書館・ウェールズ国立図書館・英国研究図書館コンソーシアム(RLUK)が中核パートナーとして参加しました。

最終報告書では、本プロジェクトの概要、グローバル・データセット作成が実現した場合のユースケースに関する調査結果、中核パートナーが提供するデジタル化資料の書誌データを用いたデータセット作成作業の内容等が記載されています。

Figshareで公開されたオープンな研究データの利用傾向に関する調査(文献紹介)

2020年10月4日付で、Sage社の刊行する情報科学分野の査読誌“Journal of Information Science”のオンライン速報版の論文として、“Do researchers use open research data? Exploring the relationships between usage trends and metadata quality across scientific disciplines from the Figshare case”が公開されています。

同論文では、オープンな研究データの利用率が低い要因としてしばしば指摘されるメタデータの品質との関連の実態を調査するために、研究データ公開プラットフォームFigshare上で公開されたデータの比較・検討が試みられました。著者らは、2019年10月から11月に取得したFigshare上の全21分野・約700万件のリソースのメタデータに対する体系的な品質評価等を実施し、その分析結果を報告しています。

分析の結果として、研究分野によらずオープンな研究データの利用には偏りがありごく少数のリソースが利用全体の大半を占めていることや、データの利用と評価ツールで測定したメタデータの品質との間に有意な相関関係が認められなかったことなどを報告しています。

E2314 - 電子情報の保存・管理の標準手法"Oxford Common File Layout"

2020年7月7日,リポジトリにおける電子情報の長期保存のためのファイルシステムの階層を標準化するための手法であるOxford Common File Layout(OCFL)のVersion 1.0が公開された。OCFLのウェブサイトには仕様を示した“OCFL Specification”と実装上の助言を示した“OCFL Implementation Notes”等が公開されている。

北米研究図書館協会(ARL)、研究データへの取組に関する推奨事項をまとめた報告書“Implementing Effective Data Practices”を公開

2020年9月25日、北米研究図書館協会(ARL)は、研究データへの取組に関する推奨事項をまとめた報告書“Implementing Effective Data Practices: Stakeholder Recommendations for Collaborative Research Support”の公開を発表しました。

同報告書は、ARL・カリフォルニア電子図書館(CDL)・米国大学協会(AAU)・公立ランドグラント大学協会(APLU)が2019年12月に開催した招待会議で得られた情報・洞察に基づいています。同会議は米国国立科学財団(NSF)の後援のもと行われ、(1)データセットに永続的識別子(PID)を使用する、(2)機械可読のデータ管理計画(maDMPs)を作成する、というNSFが推奨する研究データへの取組のためのガイドライン設計に焦点が当てられました。

同報告書では、研究者、学術・研究図書館、リサーチオフィス、ITスタッフ、学術出版社、ツール開発者、学会、助成機関といったステークホルダーに対し、NSFが推奨するこれらの取組を実装するに当たってのインセンティブと推奨事項等を個別に示しています。

OCLC Research、次世代のメタデータへの移行に関する報告書を公開

2020年9月29日、OCLC Researchが、次世代のメタデータへの移行に関する報告書“Transitioning to the Next Generation of Metadata”を公開しました。

同報告書は、 メタデータ管理に関する活動を行うフォーカスグループ“OCLC Research Library Partners Metadata Managers Focus Group”による、2015年から2020年にかけての議論や、「次世代のメタデータ(next generation of metadata)」に関する予測をまとめたものです。

レポートでは、以下の内容等について述べられています。

・なぜメタデータに変化が起きているのか。
・メタデータ作成プロセスはどのように変化しているのか。
・メタデータ自体はどのように変化しているのか。
・これらの変化が職員の要件にどのような影響をもたらすのか。また、図書館はどのように備えられるのか。

科学技術振興機構(JST)、J-STAGE利用発行機関向けに編集登載システムの新機能をリリース:全文XML作成ツールの提供・PMC、DOAJ形式ファイルのダウンロード機能など

2020年9月15日、科学技術振興機構(JST)は、JSTの構築する電子ジャーナル出版推進のためのプラットフォームJ-STAGEについて、利用発行機関向けに編集登載システムの新機能をリリースすることを発表しました。

編集登載システム新機能のリリースは2020年9月26日に実施されました。新機能のリリースによって、J-STAGE利用発行機関はWordもしくはLaTeX形式の原稿ファイルを元にJ-STAGEに登載可能な全文XMLファイルを作成・編集できるツールの利用や、J-STAGEに登載済みの記事データのPubMed Central(PMC)・DOAJ(Directory of Open Access Journals)に対応した形式のXMLファイルによるダウンロードなどが可能となっています。また、早期公開記事の改版記事を登載・公開するための管理機能や、各記事の抄録の二次利用について可・不可のフラグの設定等に関する機能も併せて公開されています。

英国図書館(BL)、Linked Data技術を用いて図書館コミュニティの目録データ等を共有しオンライン上で発見可能な環境を構築するイニシアチブ“Share-VDE”に参加

2020年9月4日、英国図書館(BL)、Linked Data技術を用いて図書館コミュニティの目録データ等を共有しオンライン上で発見可能な環境を構築するイニシアチブ“Share Virutal Discovery Environment(Share-VDE)”に参加したことを発表しました。

Share-VDEは、様々な図書館コミュニティ作成の書誌目録・典拠ファイル等の書誌情報をLinked Data技術で接続し、共有の発見環境構築を目指す図書館主導のイニシアチブです。国際的な図書館サービスプロバイダーCasalini Libriと、文化遺産部門向けの統合図書館システム(ILS)・セマンティックウェブソリューション等のソフトウェア開発会社である@Cult社が中心になって推進しています。

DataCite、PID Graphのウェブ検索インターフェース“DataCite Commons”の提供を開始

DataCiteは、2020年8月27日付けのブログ記事において、永続的識別子(PID)の付与された学術リソースとリソース間の関連性を視覚化する“PID Graph”のウェブ検索インターフェースとなる“DataCite Commons”の提供開始を発表しました。現在も開発が進められており、正式な立ち上げは2020年10月を予定しています。

記事中では、“DataCite Commons”の最も重要な機能の一つとして、DataCiteやCrossrefなど、学術コンテンツのDOI(デジタルオブジェクト識別子)登録機関のうちどの機関が登録したDOIであるかを問わず、DOIの横断検索が可能となることを挙げています。また、“PID Graph”のウェブ検索インターフェースとして、DOIを付与されたコンテンツと研究者・研究機関・助成機関との関係性を示す機能も備えています。

DataCite Commons - Exploiting the Power of PIDs and the PID Graph(DataCite Blog, 2020/8/27)
https://doi.org/10.5438/f4df-4817

ページ