CA1606 – Google Scholar,Windows Live Academic Searchと図書館の役割 / 片岡真

PDFファイルはこちら

カレントアウェアネス
No.289 2006年9月20日

 

CA1606

 

Google Scholar,Windows Live Academic Searchと図書館の役割

 

1. はじめに

 Google,Yahoo!を始めとする検索エンジンは,公開された全てのウェブサイトを無料で瞬時に検索できる利便性から世界中で支持されている。それに伴い広告の希望も増え,検索結果などに広告を表示させて収入を得るビジネスモデルも成功を収めた。

 一方,学術文献の世界では,これまでWeb of Science(以下WoS)などライセンス契約を伴う文献データベース(ウェブ・クローリングではデータ収集できない)が中心で,図書館はこれを契約し,利用者に提供することが重要な役割であった。しかし検索エンジンのベンダー各社は,非営利の文献データベースや出版社,また図書館との提携により,この分野への進出を試行している。

 この記事では,これまでにベータ版として登場した二つの学術検索エンジンGoogle Scholar(以下GS)(E273CA1564参照)およびWindows Live AcademicSearch(以下WLAS)(E473参照)を取り上げ,その有効性を検証する。これらの学術検索エンジンは,GoogleやYahoo!などと同じように支持を集め,学術検索の世界を変える存在となるのだろうか。また,図書館の役割はどのように変化するのだろうか。

 

2. 文献データベースの機能比較について

 表は,多数の文献やベンダーからの情報をもとに,GS,WLASと,ライセンス契約の文献データベース(Scopus,WoS)の機能をまとめたものである。ScopusやWoSは,収録分野や収録誌を明確な基準で選定し,検索,表示,リンク機能もバランスよく充実させているのに対し,GSはオープンアクセス文献,自然科学分野,被引用文献表示など,限られた領域では有効に機能していることがわかる。またWLASは,ユーザーからのフィードバックを求めた試験的な公開のため,収録範囲や機能は十分ではない。

 以下,この表を基に,GSとWLASのそれぞれについて,ポイントとなる特徴を解説する。

 

表 文献データベースの機能比較(2006年7月21日現在)
※画像をクリックすると新しい画面で開きます。
表 文献データベースの機能比較(2006年7月21日現在)

 

3. Google Scholar

3.1. 概要および分野

 GSの大きな特徴の一つは,Googleで培ったウェブ・クローリング技術を学術文献収集に適用している点で,これによりオープンアクセス文献の検索に強い優位性を示している。またOAI-PMH(CA1513参照)をサポートしており,プレプリントやポストプリント,機関リポジトリ文献も検索可能である。非英語文献については,フランス語,ドイツ語,スペイン語などヨーロッパ言語のほか,日本語にも対応し始めており,原文の言語で検索できるところが特徴的である。

 しかし一方で,ウェブ・クローリングや出版社との提携,PubMedなどに頼ったデータ収集は,GSで何が検索できるのかをわかりにくくしている。それは分野によるカバー率の違いにも表れており,例えば情報科学,生物学,医学分野では網羅性が高く,数学,化学,農学,社会科学では中程度,人文科学,地球惑星科学分野の文献はあまり収録されていないといった具合である。この点は,明確な選定基準に基づき,表紙から裏表紙までのすべてを対象に(Cover to Cover)記事収録を行うScopusやWoSとは大きく異なる。

 また,現時点ではデータ更新の頻度が安定しておらず,速報性に欠ける点にも注意が必要である。

3.2. 被引用文献表示

 被引用回数の表示およびリンクは,GSのもう一つの大きな特徴であり,査読雑誌よりもオープンアクセス文献(会議録,テクニカルレポート,学位論文などを含む)からの引用によく対応している。フルテキストからの参考文献データ抽出,引用元へのリンク,そして被引用回数の表示まで,全てのプロセスは機械的に行われるため,一部精度的な問題も指摘されているが,文献ごとに見ると,GSの被引用回数はWoSのものと比例することが報告されている。つまり,WoSで特定の論文が他の論文に比べて10倍多い被引用回数を示す場合,GSでも10倍多い被引用回数を示すということである。また,GSはScopus やWoSが持たないユニークな被引用文献を多く収録しており,これらを併用する効果は高い。

3.3. 検索機能

GSは検索語の組み合わせの他に,論文タイトル,著者,雑誌名,出版年,主題分野(一部)の指定が可能であるが,単語内のトランケーションや語形変化には対応していない。また,ソート順は文献の被引用数と検索語との関連性の組み合わせによる適合性のみが提供されているが,引用される機会の少ない最新文献は上位に表示されにくい。

 これに対し,Scopus やWoSでは,単語内トランケーション,様々なソート順,ファセット分類による絞り込み検索,更に著者インデックスの提供など,積極的な機能充実を図っている。

3.4. リンク機能

 GSはOpenURLリンクリゾルバにも対応している(E321参照)。GSに自機関のベースURL,リンク文字列,IPアドレス・レンジなどを提供しておけば,自動的に,検索結果へ自機関のOpenURLリンクが表示される。また機関外からは,「Scholar設定」で自機関設定が行える。なお,ExLibris社はGoogle Scholarからの利用に限定した無料のリンクリゾルバScholarSFXを用意している。

 そのほか,OCLC WorldCatを始めとする総合目録,BL Directを利用したドキュメント・デリバリーへのリンクにも対応し,利便性を向上させている。

 

4. Windows Live Academic Search

4.1. 概要

 WLASは,現在日本を含む7か国で限定公開されている実験的な段階であり,検索対象はACM,IEEE,Institute of Physicsなどの学会系出版社のほか,エルゼビア(一部),ブラックウェル,ワイリー,Taylor & Francisなど,一部商用出版社の文献に限られる。

 GSがウェブ・クローリングを中心にデータ収集を行っているのと異なり,WLASのデータ収集は出版社との提携が中心である。実際には,CrossRef(CA1481参照)からDOIやメタデータを取得し,更に出版社の意向によって,電子ジャーナルを提供するサイトから文献の抄録情報を収集する。

 また,OAI-PMHもサポートしており,現在収集対象としているarXivのほか,OAI-PMH準拠の様々なリポジトリからデータ収集を進める計画がある。

4.2. 被引用文献表示

 被引用文献の表示では,オープンアクセス文献の被引用情報が調べられるCiteSeer(http://citeseer.ist.psu.edu/)と連携している。しかしCiteSeerには商用出版社から刊行された文献は含まれないため,これで探索できる文献はかなり限定される。

4.3. OpenURLリンクリゾルバ

WLASは図書館との連携も重視しており,GSと同様,OpenURLリンクリゾルバに対応している。機関外からの設定は現在行えないが,今後可能となる予定である。

 WLASは,現時点では収録データ,検索・表示機能ともに,実用レベルでのサービス提供が行われていない。しかし,多くの学術出版社は視認性向上のため,学術検索エンジンとの提携を前向きに考えており,近い将来,網羅性の高い,強力なツールへ成長することを予感させる。

 

5. 図書館の役割

 研究者は,Googleと同様,学術検索においても,一度の検索で全ての文献を発見,入手できる環境を求めている。

 GSはこうした環境の実現に向け,新しい可能性を示したが,現時点では,その効果はオープンアクセス文献や特定分野の検索に限定される。

 Scopus,WoSは,広範囲に渡る学術分野を網羅し,主として査読された雑誌論文の検索に威力を発揮するが,オープンアクセス文献への対応は十分とは言えない。また,各研究分野の網羅的な文献収集を行う場合は,PsycINFO,MathSciNetといった,分野に特化したデータベースが最適であるかもしれない。

 このような,決定的な学術検索ツールが存在しない状況では,図書館による最適な検索ツールの提案や,一次文献入手手段の整理が重要で,それが研究者の情報入手効率を大きく左右することになる。中でも,検索時のリソース選択の複雑さを解決する方法として統合検索システムが,検索結果から一次文献を効率的に入手する手段としてリンクリゾルバが,それぞれ注目されている。

5.1. 統合検索システム

 統合検索システムとは,有料・無料の区別なく,様々なリソースを一括して検索し,結果表示を行うものである。GSやWLASが文献データを事前に収集し,インデックスを作成しているのに対し,統合検索システムは検索要求を受けてから,指定された複数のリソースへ同時にアクセスするため,結果表示までに多少時間がかかるが,誰でも簡単に検索結果を引き出すことができる。また,検索手段の単純化によって,研究者の検索時間節約や,普段使わないリソースからの情報発見も期待できる。

 しかし,多くのリソースを同時に検索する場合,ノイズも多くなるため,逆に必要なものが見つかりにくい弊害もある。この問題に対応するため,統合検索システムのベンダーは,検索グループのカテゴリ化,クラスタ分析からの絞り込み検索機能,重複除去といった機能強化に取り組んでいる。

5.2. リンクリゾルバ

 リンクリゾルバは,検索結果から電子ジャーナル,冊子の所蔵確認,ILL申し込みなど,各機関の事情に即したリンクを提供するツールである。ライセンス契約のデータベースだけでなく,GS,WLAS,PubMed,OPACなど,様々なリソースから利用できるところに特徴があり,研究者の行動に添った一次文献ナビゲーションとして効果を上げている。

例えば,九州大学附属図書館がサービスするリンクリゾルバ「きゅうとLinQ」は,クリックするだけで的確に一次文献にたどり着ける簡便さから広く研究者に支持され,電子ジャーナルや文献データベースの利用増加にも大きく貢献した。また,GSなど無料リソースの検索結果に図書館が提供するサービスへのリンクを自動表示させたことは,研究者を驚かせ,図書館に対する期待を高めた。

5.3. 図書館員として

 統合検索システム,リンクリゾルバは,利用者とリソース,そして一次文献を結ぶ大変便利なツールである。しかし,こうしたツールに頼るだけでなく,図書館員一人一人が,利用者に有効なリソース選択や,調べ方を提案できる存在であることが重要である。自機関が契約する電子リソースや受入した図書・雑誌資料ばかりでなく,GSやWLASを始めとする,ウェブ上で利用できる様々な無料リソースをどう活用すればよいのかについてもよく知り,適切に提示することこそが,今図書館に求められているのではなかろうか。

九州大学附属図書館:片岡 真(かたおか しん)

 

Ref: MacColl, John. Google Challenges for AcademicLibraries. Ariadne. (46), 2006. (online), available from< http://www.ariadne.ac.uk/issue46/maccoll/ >, (accessed2006-07-21).

Google. “Googhe Scholar”. (online), available from < http://scholar.google.com/ >, (accessed 2006-07-21).

Microsoft. “Windows Live Academic Search”. (online),available from < http://academic.live.com/ >, (accessed 2006-07-21).

久保田壮一ほか. JSTリンクセンターの新機能─Googleとの連携とJ-STAGEにおける論文の被引用関係表示. 情報管理. 49(2), 2006, 69-76.

Neuhaus, Chris et al. The Depth and Breadth of GoogleScholar: An Empirical Study. Portal : Libraries and the Academy. 6(2), 2006, 127-141.

Bauer, Kathleen et al. An Examination of CitationCounts in a New Scholarly Communication Environment. D-Lib Magazine. 11(9), 2005. (online), availablefrom < http://www.dlib.org/dlib/september05/bauer/09bauer.html >, (accessed 2006-07-21).

ヤチヨ, ピーター. 引用データベースによって強化された学術情報データベースをいかに評価するか. 情報管理. 48(12),2006, 763-774.

Charbonneau, Leo. Google Scholar service matches ThomsonISI citation index. University Affairs. 2006-03. (online), available from < http://www.universityaffairs.ca/issues/2006/march/google_scholar_01.html >, (accessed 2006-07-21).

Bakkalbasi, Nisa et al. Three options for citation tracking: Google Scholar, Scopus and Web of Science. Biomedical Digital Libraries. 3, 2006. (online), availablefrom < http://www.bio-diglib.com/content/3/1/7 >, (accessed 2006-08-10).

Noruzi, Alireza. Google Scholar: The New Generation of Citation Indexes. Libri. 55(4), 2005, 170-180.

Grogg, Jill E. OpenURL Linking with Google SCHOLAR.Searcher: Magazine for Database Professionals. 13(9),2005, 39-46.

Ex Libris. “Google Scholar and SFX: New Opportuni-ties for Libraries and Researchers”. (online), availablefrom < http://www.exlibrisgroup.com/scholar_sfx.htm >, (accessed 2006-07-21).

British Library desktop document delivery now available via Google Scholar. (online), available from < http://www.bl.uk/news/2006/pressrelease20060302.html >, (accessed 2006-08-10).

Rogers, Michael. Microsoft Beta Testing WindowsLive Academic Search. Library Journal. 2006-05-15. (online),available from < http://www.libraryjournal.com/article/CA6332173.html >, (accessed 2006-07-21).

Jacso, Peter. “Windows Live Academic”. Gale ReferenceReviews. (online), available from < http://reviews.gale.com/index.php/digital-reference-shelf/2006/05/windows-live-academic/ >, (accessed 2006-07-21).

Sadeh, Tamar. Google Scholar Versus Metasearch Systems. HEP Libraries Webzine. (12), 2006. (online),available from < http://library.cern.ch/heplw/12/papers/1/ >, (accessed 2006-07-21).

片岡真. リンクリゾルバが変える学術ポータル−九州大学附属図書館「きゅうとLinQ」の取り組み−. 情報の科学と技術. 56(1), 2006, 32-37.

片岡真. リンクリゾルバに見るWeb時代の図書館サービス:きゅうとLinQの評価と展望. 薬学図書館. 51(4), 2006.掲載予定.

 


片岡真. Google Scholar,Windows Live Academic Searchと図書館の役割. (小特集:Googleの新サービスが与える影響) カレントアウェアネス. (289), 2006, 19-22.
http://current.ndl.go.jp/ca1606