E829 – Google,過去の新聞記事のデジタル化・オンライン提供に着手

カレントアウェアネス-E

No.135 2008.09.17

 

 E829

Google,過去の新聞記事のデジタル化・オンライン提供に着手

 

 Google社は2008年9月8日,新聞社や出版社と提携して,過去の新聞記事をデジタル化し,オンライン上で検索・閲覧可能にするプロジェクトを開始した。Google社の最終目標は,同社が数十億ページあると試算する,あらゆる新聞の紙面にすべての人々がアクセスできるようにすることだという。

 2006年にGoogle社は,New York Times紙やWashington Post紙といった新聞社と協力して,デジタル化された新聞記事にインデックスを付けて“Google News Archive”として検索可能にする,という取組みに着手していたが,今回のプロジェクトはそれをさらに拡大したものとなる。現在,Google社の協力で記事をデジタル化し,プロジェクトに参加する“News Archive Partner Program”のパートナー企業を募集しているほか,プロジェクトに興味を持った新聞社や出版社の連絡を受け付けている。2008年9月8日時点で,ProQuest社(出版アグリゲータ),Heritage社(マイクロフィルム製作),Quebec Chronicle-Telegraph社(北米で最も歴史の古い新聞社)の参加が公表されている。

 現在,プロジェクトの下にある新聞記事はGoogle News Archiveで検索・閲覧可能である。Google News Archiveには,検索クエリと関連の強い順に結果を表示する機能に加え,検索クエリに関連のある記事を時系列に表示して,歴史的背景の理解を助ける機能も備わっている。なお検索対象の記事には,Google社がウェブサイトを巡回して収集したものと,News Archive Partner ProgramによってGoogle社がデジタル化したものの2種類があり,前者の記事を読む場合は,ニュースを配信している企業のウェブサイトへ飛ぶことになる。また,無料で閲覧可能なもの(BBC News,Guardianなど)と,全文を閲覧するためには利用料が必要なもの(Washington Post Archives,New York Times Archivesなど)がある。今後Google News Archiveの記事数・インデックス数が増えれば,メインのGoogle検索エンジンでも新聞記事のフルテキスト検索ができるようにする予定であるという。

 米国議会図書館(LC)と全米人文科学基金(NEH)とが協同で実施している全米電子新聞プログラム(NDNP;E684参照)を始め,国家レベルで過去の新聞記事のデジタル化事業には取り組む図書館は少なくない(CA1577参照)。Google社がプレイヤーとして参加したことにより,各国,各機関で進行中の新聞デジタル化・オンライン提供という事業がどのような影響を受けるのか,注視していく必要があるだろう。

Ref:
http://googleblog.blogspot.com/2008/09/bringing-history-online-one-newspaper.html
http://news.google.com/archivesearch
http://www.proquest.com/pressroom/pressrelease/08/20080908.shtml
http://www.qctonline.com/node/1645
http://internet.watch.impress.co.jp/cda/news/2008/09/09/20796.html
http://jp.techcrunch.com/archives/20080908google-expands-online-newspaper-archive-search/
http://japan.cnet.com/marketing/story/0,3800080523,20380034,00.htm
http://www.itmedia.co.jp/news/articles/0809/09/news032.html
CA1577
E684