ウェブ上にある大規模データの収集・加工・提供に関する知を共有するサイト“theinfo.org”

RSS1.0の仕様の策定、Internet ArchiveのOpen Libraryなどのプロジェクトに関わった米国の著名プログラマー・シュワルツ(Aaron Swartz)氏が、ウェブ上にある大規模データの収集(スクレイピング、クローリングなど)、加工(変換、協同フィルタリングなど)、提供(テーブル化・グラフ化・地図化を含むウェブサイト化)に関する知識を共有するためのウェブサイト“theinfo.org”を立ち上げました。メーリングリスト、有益なツールやノウハウ、大規模データを提供しているウェブサイト、大規模データをうまく見せているウェブサイトなどが紹介されていますほか、このプロジェクトの一環として、“Simple Book Search”なる書籍検索インターフェースも公開しています。

theinfo.org
http://theinfo.org/

Simple Book Search
http://books.theinfo.org/

Aaron Swartz
http://www.aaronsw.com/

January 17, 2008付けPeter Scott’s Library Blogの記事
http://xrefer.blogspot.com/2008/01/theinfoorg.html