E543 – Google Book Searchの機能拡張とミシガン大の新プロジェクト−図書の所蔵情報や本文データを用いた新たなサービスの幕開け

カレントアウェアネス-E

No.91 2006.09.20

 

 E543

Google Book Searchの機能拡張とミシガン大の新プロジェクト−図書の所蔵情報や本文データを用いた新たなサービスの幕開け

 

 2006年8月から9月にかけて,“Google Book Search”(E285参照)に新たな2つの機能が追加されたほか,“Google Book Search”プロジェクトで協同関係を組むミシガン大学図書館でも,プロジェクトの結果得られた本文データを利用して,新たな蔵書提供サービスが開始された。  

 まず“Google Book Search”では,検索結果から所蔵する図書館を参照できる機能が8月24日に追加され,続いて同30日には,著作権が消滅しパブリックドメインとなった図書の全文を,pdfフォーマットで公開するサービスが追加された。前者では検索結果表示画面の“Find libraries”をクリックすると,OCLCのWorldcatの画面が表示され,所蔵図書館の検索が可能となる。Google 公式ブログによると,世界15か国以上の総合目録を網羅し,30か国以上の図書館の蔵書検索ができるという。ただし現時点では日本語には未対応である。また後者では,検索結果から“Full View”画面の“Download”ボタンをクリックすると,pdfデータ化された本文画像がダウンロードできる。ダウンロード可能な図書は,著作権存続期間が終了した,いわゆるパブリックドメインと呼ばれるものに限られ,pdfファイルの冒頭には使用ガイドラインが添付されているほか,各ページにGoogleが作成したことを示す透かしが挿入されている。なお現時点では,対象となる図書すべてのpdfファイルが登録されているわけではないようだ。 

 一方,ミシガン大学のプロジェクトは“MBooks”と呼ばれ,既存の図書館蔵書検索システムを拡張し,同大学が“Google Book Search”プロジェクトに協力して得た図書のデータを用いて,検索と提供システムの充実を図ろうとするものである。具体的にはOCRで認識した本文情報を蔵書検索の対象とするほか,著作権存続期間が満了した図書の本文テキストデータを提供する。提供するテキストデータでは,検索語がハイライト表示される。Webで提供される本文画像データは1ページごととなり,全文一括での入手は“Google Book Search”を利用するように呼びかけている。また“Google Book Search”では提供されていない連邦政府の刊行物についても,著作権による保護対象ではない(uncopyrightable works)ことを理由に,提供するという。対して著作権存続中の図書は本文を表示せず,かわりにページごとの検索キーワードの頻出度を表示する。これはILLサービスに対する利便性を考慮したとのことである。対象となる言語はアルファベット,キリル文字,ギリシャ文字で表記された図書で,ほかの言語の提供時期は未定とのことである。

Ref:
http://googleblog.blogspot.com/2006/08/finding-wealth-in-your-library-and.html
http://googleblog.blogspot.com/2006/08/download-classics.html
http://www.lib.umich.edu/aael/news.php?newsID=150
http://mdp.lib.umich.edu/m/mdp/mdp-faq.htm
http://www.lib.umich.edu/mdp/index.html
http://www.infotoday.com/newsbreaks/nb060905-2.shtml
http://chronicle.com/free/2006/08/2006083101t.htm
E285