RSS1.0の仕様の策定、Internet ArchiveのOpen Libraryなどのプロジェクトに関わった米国の著名プログラマー・シュワルツ(Aaron Swartz)氏が、ウェブ上にある大規模データの収集(スクレイピング、クローリングなど)、加工(変換、協同フィルタリングなど)、提供(テーブル化・グラフ化・地図化を含むウェブサイト化)に関する知識を共有するためのウェブサイト“theinfo.org”を立ち上げました。メーリングリスト、有益なツールやノウハウ、大規模データを提供しているウェブサイト、大規模データをうまく見せているウェブサイトなどが紹介されていますほか、このプロジェクトの一環として、“Simple Book Search”なる書籍検索インターフェースも公開しています。
theinfo.org
http://theinfo.org/
Simple Book Search
http://books.theinfo.org/
Aaron Swartz
http://www.aaronsw.com/
January 17, 2008付けPeter Scott’s Library Blogの記事
http://xrefer.blogspot.com/2008/01/theinfoorg.html