PDFファイルはこちら
カレントアウェアネス
No.325 2015年9月20日
CA1857
動向レビュー
米国デジタル公共図書館(DPLA)の過去・現在・未来
電子情報部電子情報サービス課:塩﨑亮(しおざき りょう)
電子情報部電子情報サービス課:佐藤健人(さとう けんと)
電子情報部電子情報サービス課:安藤大輝(あんどう だいき)
1.はじめに
米国デジタル公共図書館(Digital Public Library of America:DPLA)とは、米国各地の図書館・博物館・文書館等が有するデジタルコンテンツのメタデータを集約し、制約なく市民に提供する一大事業である。各地域に建造物として存在する物理的な「公共図書館(public library)」ではない。類似事業の欧州のEuropeana(CA1785参照)と同様、既に日本においても多数紹介がなされ(E1429、E1235、E1164、E1105参照)、実際にDPLAのイベントに参加した事例の報告もある(1)。
DPLAのような、大量かつ分散する情報を一元的にコントロールしようとする壮大な試みは、例えば、古くはオトレらの『世界書誌目録』から、近時のGoogleやディスカバリサービスに至るまで多数挙げられ、歴史は繰り返されていくのかもしれない。本稿では、その試みのうちの一つとして、昨今さまざまな活動を展開しているDPLAについて、これまであまり触れられていない点を中心に、批判的な見解も含めて、過去・現在・未来について簡単に整理したい。なお、特に現在・未来の記述については、主に2015から2017年を対象とした「戦略計画」(2)(E1646参照)に拠ることとし、逐一の参照は避けることとした。
2.過去
まだ揺籃期ではあるだろうが、DPLAのこれまでの動向(3)を時系列順に整理してみよう(表1)。
表1 DPLAの動向
年 | 月 | 内 容 |
2010 | 10 | 非公式カンファレンス(ハーバード大学)で 「全米デジタル図書館」構想発表 |
2010 | 12 | DPLA構築へ向け、ハーバード大学バーク マンセンターに事務局開設 |
2011 | 10 | 初の総会開催 |
2012 | 8 | システム開発の調達開始 |
2013 | 4 | NPO法人として認可 |
ポータルサイトの公開 | ||
2015 | 1 | 3か年の「戦略計画」発表 |
2015 | 4 | DPLAfest2015の開催(2回目) |
構想段階からポータルサイト公開までは約2年半に過ぎず、比較的早いスピードで事業が展開されてきたといえる。ポータルサイトでは、通常の文字列による検索以外にも、地図検索やタイムライン検索が提供されており、公開時の反応は上々だったようである。米国のTIME誌が選ぶ2013年のウェブサイトトップ50に選出されてもいる(4)。
しかし、少なくとも公開前には、何を目指しているのか、どのように実現するのか等が不明瞭であるとの懐疑的な見解も多数あったようである(5)。公開時には、市民というより、図書館員に向けて事業が展開されている感が強いとのコメントも見受けられた(6)。また、各公共図書館の存在意義を減じることにつながらないか、あるいは、Google Books、Internet Archive、プロジェクトグーテンベルクなど既にあるサービスと重複していないか、といった懸念も生じている(7)。
他方、「公共図書館」の呼称もまた議論を呼び、名称変更の要望書も出されていた(8)。しかし、コミュニティ形成の場としての、あるいは、情報・技術格差を是正する社会制度としての公共図書館の役割すべてをDPLAが代替できるものではないという認識は、運営者側も十分に承知していた(9)。DPLA側はむしろ、個別の公共図書館や大学図書館とは相互補完的な関係にあると答えてきた(10)。具体的な対応として、公共図書館との結びつきを強めるために、DPLAの運営委員会に公共図書館からのメンバーが加えられてきた(11)。おそらく、後述する電子書籍への対応等の動きも、公共図書館側のニーズを強く意識したものであろう。
3.現在
このように、必ずしも順風満帆な船出だったとまではいえないDPLAだが、現状はどこまで成長を遂げたのだろうか。
3.1 コレクション
DPLAのウェブサイト(12)で確認する限り(2015年6月10日時点)、メタデータ件数は1,000万件を超え、連携しているハブの数は33(「サービスハブ」17、「コンテンツハブ」16)、機関単位では各ハブの参加館を含めた約2,000機関と連携している。「戦略計画」からわかる参加機関の内訳を見ると、公共図書館23%、大学図書館22%、歴史資料館11%、博物館11%、文書館7%、その他26%(2014年4月時点)となっており、公共図書館が最も多い。なお、DPLAへの参加後、アクセス数が2倍程度に増加した機関もあったという(13)。
メタデータを効率的に集約するため、DPLAは二つの収集ルートを想定している。一つは、「サービスハブ」(州単位で複数機関のデータを集約している連携先)からの収集である(例:ミネソタ州、ジョージア州)(14)。「サービスハブ」になるには、DPLA参加時のデータ投入件数が5万件以上であることが要件となっている。「サービスハブ」のホスト機関は、参加機関の取りまとめ役、DPLAとの窓口役を果たす。DPLAとしては、既に集約済のデータを収集することができ、また、各地域でのイベント開催等を展開するにあたり、欠かせない「ハブ」ができる。
もう一つは、「コンテンツハブ」(大規模リポジトリで、DPLAと直接データ連携する)からの収集である(例:ハーバード大学図書館、HathiTrust(CA1760参照)、Internet Archive)(15)。地域ベースでなく、主題別やメディア別に構築されていて、単一の機関からなる場合もあれば、複数機関のコレクションを集約したものもある。コンテンツハブとなるには、DPLA参加時のデータ投入件数が20万件以上であることが要件である(DPLAのポータルサイト公開時は25万件以上)。DPLAとしては、まとまった数のデータを効率よく収集することができる。
しかし、一口にメタデータの収集といっても、連携の実現にはDPLAと参加機関双方に作業負担が伴う。参加機関向けの解説によれば(16)、連携に伴う作業は年2回行われている。例えば、1月に申込みを締切り、2月に可否を通知、3月にデータ交換覚書を取り交わし(メタデータはオープンライセンスの元で自由配布される等)、4月に登録を開始し、7月に登録を完了させるという流れである。メタデータのフォーマット(DCやMODS)、収集方式(OAI-PMH)はともに標準仕様を推奨しているが、実際には独自仕様の機関も多く、作業は必ずしも容易でない。例えば「サービスハブ」であるノースカロライナ州デジタル遺産センターにおいても、参加機関すべてがOAI-PMH 方式でデータ出力しているわけではないと報告されている(17)。なお、DPLAで収集・加工したデータを、データ提供元にフィードバックすることは、提供元での再マッピングや版管理の問題があり、現状では行われていない(18)。
3.2 システム
システムアーキテクチャについても触れておこう。フロントの主要部分や内部APIはRuby on Rails、データベースはCouchDB/PostgreSQL、検索エンジンはElasticsearch、登録システムはPythonベースで構築されている(19)。国内の参加機関だけでなく、EuropeanaやオーストラリアのTrove、ニュージーランドのDigitalNZなど国外の類縁機関との技術的な情報共有も進められている。DPLAのメタデータ仕様(Metadata Application Profile: MAP)は、Europeana の標準メタデータ仕様EDM をモデルとして開発された。また、標準技術やオープンソースソフトウェアを可能な限り採用するとともに、ソースコード等はGitHubで公開されている。メタデータは、検索画面からだけでなく、ウェブAPIを介しても提供されている。(返戻データの形式はJSON-LD)(20)。既に1,000件以上の利用申し込みがあったという。メタデータの利活用を促すため、開発者を対象として、ハッカソン、各種講演等のアウトリーチ活動も精力的に行っているようである。なお、ウェブAPIに加えて、全件データの圧縮ファイルでもメタデータを提供しており、利用に当たって特段の認証・申請は不要とされている(21)。
3.3 資金源
これらの多様な活動は、多くの外部資金源に支えられている。「戦略計画」の記載をもとに、主な助成金を表にまとめた(表2)。
表2 DPLAへの助成金
助成機関 | 年 | 金額(万ドル) | 主な用途 |
Sloan財団 Arcadia基金 | 2011 | 500 | 構築支援 |
NEH | 2012 | 100 | 構築支援 |
IMLS | 2012 | 25 | 構築支援 |
Knight財団 | 2012 | 100 | 構築支援 |
Gates財団 | 2013 | 100 | 図書館員向け研修 |
Mellon財団 | 2014 | 59 | 体制強化 |
Whiting財団 | 2014 | 8 | 教育コンテンツの充実 |
IMLS | 2015 | 10 | ハブ拡大 |
NEH | 2015 | 25 | ハブ拡大 |
4.未来
4.1 コレクションの拡大
「戦略計画」では、「サービスハブ」の完備が最優先であると明言されている。2017年までに、全米50州及びコロンビア特別区すべてをカバーすることが目標だという(年に10から12のハブ追加の計画(22))。「コンテンツハブ」は補完的な位置づけである。なお、「サービスハブ」が存在しない州のデジタルアーカイブで、コンテンツ数が20万に満たない機関は、DPLAとの連携ルートができない。しかし、連携機関の追加作業は労働集約的であるため、限られた人員のもとでは、要件を緩和することは当面ないという。むしろ、各州に存在する大規模なデジタルアーカイブをサービスハブとして育てていく方向性を模索していると思われる。
コレクション構築の方針としては、量よりも質を重視するという。多様な資料を対象とするが、ウェブページや画像投稿サイト、デジタル化した新聞、研究データセットなどは対象とされていない。
一方、電子書籍については、公共図書館での普及が進んでいることもあり、より重きを置いているようだ。電子書籍は、ライセンス契約が一般的であり、州によっては州単位での購入を検討する動きもあるようだが、契約交渉にまでDPLAが介入することは難しいだろう。DPLAは、「公共図書館」として、電子書籍を一般市民に広く提供する役割を担うと主張している。実際には、既に200万件の電子書籍が検索対象となっているものの、ニューヨーク公共図書館等と協力して、3か年のプロジェクトで、全米規模の電子書籍プラットフォーム構築のために必要な経営資源・技術は何か、公共図書館がDPLAを電子書籍購入時のプラットフォームとして利用することが可能か、出版者との良好な関係の構築は可能か、といった課題について検討する予定だという(23)。
また、学術情報についても、コレクション構築の対象範囲に含める計画のようである。既に、北米研究図書館協会(ARL)、米国大学協会(AAU)、公立ランドグラント大学協会(APLU)の共同プロジェクト“SHared Access Research Ecosystem:SHARE”とは協力関係にあるという。機関リポジトリについても、対象範囲に含めることが検討されている。
4.2 拡張性の高いシステム
システム面では、より堅牢かつ柔軟で拡張性のあるアーキテクチャに変えていくことが最重要課題として挙げられている。公開時には専任の技術スタッフはいなかったが、3名の開発者及び技術専門のマネージャーを採用し、外部コンサルタントに依存していた体制を変えつつある。自前で、新たにメタデータ登録管理システムを開発し、数年の内には各ハブでも利用可能なメタデータ収集ツールキットが開発される予定である。ResoureSync(CA1845参照)には未対応だが、ツールキットに組み込むこともありうるとの記述も見られる(24)。また、メタデータ形式も、MAPをバージョン4に改訂し、RDF、Linked Open Dataへの対応を図っている(25)。なお、これまでのメタデータ収集だけでなく、デジタル化コンテンツの保管サービスも視野に入れているという。
4.3 持続性の担保
これら新たな活動の持続性を担保するため、助成団体、企業、篤志家など、より多様な資金源を獲得することが目指されている。また、運営組織を小規模にとどめておくことも、事業の持続性にとっては重要だと考えられている。「戦略計画」策定時点でも、経理等は外注していることもあり、常勤のスタッフは、技術スタッフを含めて11名に過ぎない。とはいえ、この先2、3年にわたりプロジェクトをより進展させるためには、システム開発とコンテンツ収集について、それぞれ3、4名の増員が必要だという。予算は2014年度が150万ドル、2015年度で200万ドル、2017年度は300から350万ドルの見込みと報告されている。なお、米国博物館・図書館サービス機構(Institute of Museum and Library Services:IMLS)や全米人文科学基金(National Endowment for the Humanities:NEH)からの助成は受けてきたが、それ以外の政府関連機関からの助成の見込みは不明であるという。
4.4 活動範囲の多様化
また、より広い利用を促すためにアウトリーチ活動の継続が欠かせないとされている。米国議会図書館(LC)のアメリカン・メモリーも授業での利活用が促されてきたが(CA1243参照)、同様にDPLAも、特に教育の場での利活用を重点領域としている。コンテンツの教育利用に関する調査も実施されており、例えば、K-12(幼稚園から高校までの13年間)のニーズを満たす教材を教師等と協同で作成すること、編集可能なツールを提供し、アプリ開発等を促すことなどが報告書で提言されている(26)。
おそらくこの他にも、「戦略計画」に記載のない活動にDPLAは柔軟に取り組んでいくであろう。例えば、総会に該当するイベントであるDPLAFest2015では、次のようなプロジェクトが紹介されている(27)。
・教育・教養番組を提供する公共放送サービス(Public Broadcasting Service:PBS)との協力
・米国教育省が立ち上げた、教育コンテンツのオープン化を進めるLearning Registryへのデータ提供
・HathiTrust との協同による電子書籍のオープン化の推進
・スタンフォード大学、DuraSpace との協同によるリポジトリソフトHydraの改修
5.おわりに
DPLAは、その名のとおり米国の人々を対象としたポータルであるのみならず、国際的なプラットフォームとなりうるのかもしれない。確かにその構想は、着々と実現されている。特に、電子書籍対応や教育面での利活用促進など、今後の展開には目が離せない。とはいえ、米国図書館協会(ALA)やOCLCとの協力関係が明示的に見られない点は興味深い(28)。DPLAは重要なパートナーだとALA側は述べているものの、具体的な関係は不明なままである(29)。また、LC が提供するアメリカン・メモリーとの関係も定かでない。「サービスハブ」経由でデータは検索対象となっているが、直接データを提供しているわけではないようである。また、DPLAの最終的なかたちが不明であるとの指摘(30)、さらに、DPLAが本当に求められているのかという問いかけ(31)には、まだ明確に答えられてはいないのではないか。
翻って日本を見ると、類似サービスとして、国立国会図書館サーチ(NDLサーチ)などが挙げられる。収録するメタデータ件数や収録範囲という点で見ると、NDLサーチはDPLAに引けを取らない。むしろ、機関リポジトリを含む学術情報を既に対象としている点など、DPLAに先行している部分も多い。ただし、多様なデジタルアーカイブを対象とした全国規模の協力ネットワークを構築するアプローチなどについては、DPLAから学ぶべき点は大いにある。対話の開始は双方にとって有益となろう。
(1)時実象一. 米国デジタル公共図書館(Digital Public Library of America: DPLA). 図書館雑誌. 2013, 107(2), p. 118-120.
時実象一. DPLAfest 2015. 情報管理. 2015, 58(4), p. 313-318.
(2)”DIGITAL PUBLIC LIBRARY OF AMERICA STRATEGIC PLAN 2015 through 2017″. Digital Public Library of America. 2015-01.
http://dp.la/info/wp-content/uploads/2015/01/DPLAStrategicPlan_2015-2017-Jan7.pdf, (accessed 2015-06-12).
(3)”DPLA Timeline and Reading List”. Digital Public Library of America.
http://dp.la/info/wp-content/uploads/2014/04/DPLA-Reps-Timeline-and-Reading-List-2-17-15.pdf, (accessed 2015-06-12).
(4)”Awards”. Digital Public Library of America.
http://dp.la/info/about/awards/, (accessed 2015-06-12).
(5)Johnson, Peggy. The Digital Public Library of America. Technicalities. 2012, 32(5), p. 2-4.
(6)Enis, Matt. “Librarians Respond to DPLA Launch”. The Digital Shift. 2013-04-19.
http://www.thedigitalshift.com/2013/04/digital-libraries/librarians-respond-to-dpla-launch/, (accessed 2015-06-12).
(7)Cottrell, Megan. A Digital Library for Everybody. American Libraries Magazine. 2013, 44(3-4), p. 44-47.
(8)Vandegrift, Micah. “The Digital Public Library of America: Details, the Librarian Response and the Future”. In the Library with the Lead Pipe. 2013-04-24.
http://www.inthelibrarywiththeleadpipe.org/2013/dpla/?print=pdf, (accessed 2015-06-12).
(9)Edgerton, Katie. “The Digital Public Library of America and Other Urgent Projects”. MIT Communications Forum. 2012-11-01.
http://web.mit.edu/comm-forum/forums/digital_public_library.html, (accessed 2015-06-12).
(10)Palfrey, John. What is the DPLA?. Library Journal. 2013, 138(7), p. 38.
(11)Carr, Nicholas. “The Library of Utopia”. MIT Technology Review. 2012-04-25.
http://www.technologyreview.com/featuredstory/427628/the-library-of-utopia/, (accessed 2015-06-12).
(12)”Hubs”. Digital Public Library of America.
http://dp.la/info/hubs/, (accessed 2015-06-12).
(13)Scardilli, Brandi. A Look at the DPLA’s First Year. Information Today. 2014, 31(3), p. 1, 35-36.
(14)”Service Hub Application Questions”. Digital Public Library of America.
http://dp.la/info/wp-content/uploads/2014/12/2015-cycle1-ServiceHubApplication.pdf, (accessed 2015-06-12).
(15)”Content Hub Application Questions”. Digital Public Library of America.
http://dp.la/info/wp-content/uploads/2014/12/2015-cycle1-ContentHubApplication.pdf, (accessed 2015-06-12).
(16)”Become a Hub”. Digital Public Library of America.
http://dp.la/info/hubs/become-a-hub/, (accessed 2015-06-12).
(17)Gregory, Lisa; Williams, Stephanie. On Being a Hub: Some Details behind Providing Metadata for the Digital Public Library of America. D-Lib Magazine. 2014, 20(7/8), p.25-32.
(18)”Metadata Aggregation Webinar Video and Extended Q&A”. Digital Public Library of America.
http://dp.la/info/2015/01/28/metadata-aggregation-webinarvideo-and-extended-qa/, (accessed 2015-06-12).
(19)Matienzo, Mark A.; Rudersdorf, Amy. “The Digital Public Library of America Ingestion Ecosystem: Lessons Learned After One Year of Large-Scale Collaborative Metadata Aggregation”. International Conference on Dublin Core and Metadata Applications. 2014.
http://dcpapers.dublincore.org/pubs/article/view/3700/1923, (accessed 2015-06-12).
(20)”API Codex”. Digital Public Library of America.
http://dp.la/info/developers/codex/, (accessed 2015-06-12).
(21)”Bulk Download”. Digital Public Library of America.
http://dp.la/info/developers/download/, (accessed 2015-06-12).
(22)”Service Hub Application”. Digital Public Library of America.
http://dp.la/info/service-hub-application/, (accessed 2015-06-12).
(23)Cohen, Dan. “Let’s Talk about Ebooks”. Digital Public Library of America. 2015-02-23.
http://dp.la/info/2015/02/23/lets-talk-about-ebooks/, (accessed 2015-06-12).
(24)”Metadata Aggregation Webinar Video and Extended Q&A”. Digital Public Library of America.
http://dp.la/info/2015/01/28/metadata-aggregationwebinar-video-and-extended-qa/, (accessed 2015-06-12).
(25)”An introduction to the DPLA Metadata Model”. Digital Public Library of America. 2015-03-05.
http://dp.la/info/wp-content/uploads/2015/03/Intro_to_DPLA_metadata_model.pdf, (accessed 2015-06-12).
(26)Abbott, Franky; Cohen, Dan. “Using Large Digital Collections in Education: Meeting the Needs of Teachers and Students”. Digital Public Library of America. 2015-04-09.
http://dp.la/info/wp-content/uploads/2015/04/Using-Large-Collections-in-Education-DPLA-paper-4-9-15-2.pdf, (accessed 2015-06-12).
(27)DPLA. “The Digital Public Library of America Announces New Partnerships, Initiatives, and Milestones at DPLAfest 2015”. Digital Public Library of America. 2015-04-18.
http://dp.la/info/2015/04/18/the-digital-public-libraryof-america-announces-new-partnerships-initiatives-andmilestones-at-dplafest-2015/, ( accessed 2015-06-12).
(28)Vandegrift, Micah. “The Digital Public Library of America: Details, the Librarian Response and the Future”. In the Library with the Lead Pipe. 2013-04-24.
http://www.inthelibrarywiththeleadpipe.org/2013/dpla/?print=pdf, (accessed 2015-06-12).
(29)Inouye, Alan. ALA’s Role in DPLA. American Libraries Magazine. 2013, 44(3-4), p. 47.
(30)Piper, Paul S. The Library’s Future is Digital HathiTrust and Digital Public Library of America as the future. Online Searcher. 2013, 37(2), p. 22-26.
(31)Cottrell, Megan. A Digital Library for Everybody. American Libraries Magazine. 2013, 44(3-4), p. 44-47.
[受理:2015-08-06]
塩﨑亮,佐藤健人,安藤大輝. 米国デジタル公共図書館(DPLA)の過去・現在・未来. カレントアウェアネス. 2015, (325), CA1857, p. 15-18.
http://current.ndl.go.jp/ca1857
DOI:
http://doi.org/10.11501/9497650
Shiozaki Ryo
Sato Kento
Ando Daiki
Digital Public Library of America: Past, Present and Future