米国議会図書館、2,500万件分の書誌データをオープンデータセットとして公開

2017年5月16日、米国議会図書館(LC)が、オンラインカタログで公開している2,500万件の書誌データのオープンデータセットを専用ウェブページ“MARC Distribution Services (data set)”からダウンロードできるようにしたと発表しています。

データはMARC形式(UTF8、MARC8、XMLの3種類)で、図書・雑誌・コンピュータファイル・手稿・地図・視聴覚資料といった幅広い資料の、1968年から2014年にかけての45年間分のデータ(タイトル・著者・出版年・件名標目・ジャンル・注記等)が含まれています。

同データは、連邦政府の様々な機関が扱う情報・データを扱うサイト“DATA.GOV”からも入手することができます。

LCでは、5月17日から5月18日にかけて、米・ジョージワシントン大学やジョージ・メイソン大学と合同で開催するHack-to-Learnワークショップにおいて、図書館員やデジタル研究者、プログラマーとともに、これらデータの活用方法について検討を行なうとのことです。

商業利用や図書館向けの有料ベースのMARC頒布サービスも引き続き実施されます。

Library Offers Largest Release of Digital Catalog Records in History
25 Million Free Records of Bibliographic Metadata(LC,2017/5/16)
https://www.loc.gov/item/prn-17-068

MARC Distribution Services (data set)(LC)
http://www.loc.gov/cds/products/marcDist.php

DATA.GOV
https://www.data.gov/

Hack-to-Learn(LC)
http://www.digitalpreservation.gov/meetings/hack-to-learn/hack-to-learn-site.html