E1321 - 図書館界におけるクラウドソーシングの動きは?

カレントアウェアネス-E

No.220 2012.08.09

 

 E1321

図書館界におけるクラウドソーシングの動きは?

 

 “クラウドソーシング”(crowdsourcing)という言葉が,この2,3年,図書館や文書館においても使用されるようになっている。図書館等の進める事業の一部を,利用者など不特定多数の主体にアウトソーシングすることを称するものである。オーストラリア国立図書館(NLA)の情報探索システム“Trove”のような成功事例が知られる一方で,図書館等が,クラウドソーシングを採用すべきか否かについての議論も存在する。

 NLAにおいては,クラウドソーシングを活用した複数のプロジェクトが進んでいる。中でも最も大規模なものは,新聞デジタル化プログラムである。

 この事業では,19世紀初頭に発行されていたSydney Gazetteを始め,建国当初からの新聞の多くがデジタル化され,その規模は,2012年7月現在700万ページ,7,000万記事に及ぶ。データはTroveで公開されている。Troveでは,画面の右にデジタル画像,左にそのテキストデータが並べて表示される。テキストデータは,もともとはOCR(光学式文字読取装置)により機械的に生成したものである。OCRは文字を100%正確に読み取れるわけではなく,特に図書館がデジタル化の対象とする古い資料の多くは,当時の印刷技術や紙質,資料の劣化のために,OCRで読取ると誤認識が発生する(CA1718参照)。実際Troveのテキストデータには多くの誤認識が存在する。利用者は,誤りに気付いた時点で,テキスト修正ボタンを押し,自由に修正作業を行うことができる。修正は匿名でも行えるが,すべての修正履歴が残るようになっており,ユーザー名を登録して行えば自分の貢献の記録が残すことができる。この修正作業は毎月200万行程度,2012年7月までの累計で7,000万行以上に対して行われている。

 この新聞デジタル化プログラムを牽引するホーリー(Rose Holley)は,図書館にとってのメリットについて,図書館が実現するには時間的・財政的・人的なリソースが足りないような大規模な事業を進めることができること,コミュニティの専門的知識や興味関心を活用することができること,データや情報源の品質を向上させ,結果として正確な検索が可能となること等があると指摘している。さらに,オンラインのコミュニティやユーザグループを構築することができることや,文化遺産に対する一般市民の所有意識や責任感につながるなど,デジタル化したデータの活用を見据えたメリットも説いている。

 このようなクラウドソーシングの手法は,現在大規模機関でも複数実施されている。米国カリフォルニア大学のカリフォルニアデジタル新聞コレクション(CDNC)の取組みは,国際図書館連盟(IFLA)のウェブサイトでも紹介された。フィンランド国立図書館でも同じく新聞のデジタル化を進めているが,同館では“Digitalkoot”というテキスト修正のゲームを開発し,国民に楽しみながら修正作業を行ってもらうユニークな手法をとっている。ニューヨーク公共図書館が始めた“What's on the Menu”という企画ではニューヨーク市内のレストランのメニューのデジタル化が進められているが,ここでもクラウドソーシングの手法がテキスト化作業に用いられている。また文書館では,米国国立公文書館(NARA)が,“Citizen's Archivist Dashboard”を立ち上げ,市民アーキビストによる歴史的資料のテキスト化を推し進めている(E1313参照)。

 一方で,懐疑的な意見もみられる。米国図書館協会(ALA)会長のストリプリング(Barbara Stripling)は,自身のブログの中で,クラウドソーシングの価値を認めつつも,図書館運営に取り入れる前に注意深く見ていく必要があるとの考えを示している。そこでは,クラウドソーシングによって生じる可能性のあるバイアスへの懸念や,目録にコメントやタグ付けを許容した際に図書館員の業務がその管理になってしまいうることへの懸念が言及されている。

 ホーリーは,利用者が自由にデータに付加価値を与えられるようにすることは利用者が望むものでもあり,図書館が社会との関係性を維持するのに役立つものである,と述べている。実際,Troveを始めとするクラウドソーシングの事業において利用者の活発な関与が確認されているところであり,今後の動向が注目される。

(関西館図書館協力課・依田紀久)

Ref:
http://trove.nla.gov.au/
http://www.dlib.org/dlib/march10/holley/03holley.html
http://trove.nla.gov.au/system/stats?env=prod#corrections
http://rose-holley.blogspot.jp/2012/02/crowdsourcing-australian-climate-change.html
http://www.abc.net.au/news/2011-11-11/treasure-trove/3662086
http://www.ifla.org/en/news/crowd-sourcing
http://www.digitalkoot.fi/en/splash
http://www.nypl.org/blog/2011/09/15/all-hands-deck-nypl-turns-crowd-develop-digital-collections
http://www.archives.gov/citizenarchivist/transcribe/
http://christinemadsen.com/2011/will-2012-be-the-year-of-crowdsourcing-in-libraries/
http://www.barbarastripling.org/crowdsourcing-%E2%80%93-a-library-phenomenon/
http://rose-holley.blogspot.jp/2012/02/crowdsourcing-knitting-patterns.html
CA1718
E1313