E130 - インターネット・アーカイブ,ウェブコレクションに検索エンジンを付加

カレントアウェアネス-E

No.23 2003.10.01

 

 E130

インターネット・アーカイブ,ウェブコレクションに検索エンジンを付加

 

 ウェブページを収集しインターネット上で公開しているインターネット・アーカイブ社は,アーカイブしたページをキーワードで検索できるツールを開発したと9月に発表した。現在試験運用している検索エンジン「Recall」は,1996年以降アーカイブしている約300億ページのうち110億ページ以上を網羅している。10月半ばには全てのページの検索が可能になるという。

 Recallには,ページが収集された年月の指定検索や,検索した語彙の関連ページ内における出現頻度のグラフ化などの機能が備えられている。また入力した語彙の関連語も合わせて表示される。Recallを開発したスタンフォード大学のパターソン(Anna Patterson)氏は,今後より性能の高いオプション機能を装着させて検索の効率をあげることを目指すと述べている。

Ref:
http://www.archive.org/web/web.php
http://www.infotoday.com/newsbreaks/nb030908-1.shtml