カレントアウェアネス-E
No.170 2010.04.28
E1042
米国議会図書館,Twitterの全公開ツイートを保存へ
米国議会図書館(LC)は2010年4月15日,ソーシャルメディアの1つであるTwitterから,公開設定の全てのツイート(Twitterに投稿された140字以内のメッセージ)のアーカイブの寄贈を受けることを公式発表した。全てのツイートとは,2006年のTwitterのサービス開始から,今後も増え続けていくツイート全部,を意味する。
Twitterに世界中の人々から投稿されるツイートは現時点で1日当たり5,000万件以上に上り,LCが寄贈を受ける過去約4年分のツイートは数十億件,データ量にして5テラバイトになる。最新のツイートは,6か月のタイムラグを経て利用可能になるという。これらのツイートのデータは専ら,研究・保存目的の活用が想定されており,LCのウェブサイトで一般公開される予定はない。ただし,これまでもLCが取り組んできた歴史的事実の記録プロジェクトの一環として,特定のトピックについて選択したツイートをウェブ公開することは検討されているという。
Library Journal誌が報じるところによると,今回の取り組みはTwitter側からLCに打診があり,実現したということである。LCではTwitterに限らず,文化的,歴史的価値が高く,同館のコレクションにふさわしいと判断されるものであれば,他のソーシャルメディア等からもデータを収集することを視野に入れている。ただし,現時点でTwitterのほかに具体的な動きはなく,今回の取り組みは,この種のデータの収集・保存・提供の方法を検討するテストケースと捉えられている。
LCがツイートを保存することについては,賛否両論がある。ツイートの蓄積が持つ,文化的,歴史的,学術的価値は評価されており,例えば,ごく普通の人々のツイートの集積から時代の様相を明らかにできる点,ウェブ上での社会的ネットワークの形成・発展過程を明らかにできる点等が注目されている。
一方,プライバシーや著作権の問題,技術的な課題を指摘する意見もある。プライバシーの問題についてLCの広報責任者は,ツイートのアーカイブは研究目的でのみ利用可能であり,また,ツイートはTwitterのユーザがウェブ上での公開に同意しているものであるため,問題はないとの見解を示している。技術的な課題の1つとして,ツイート中で多用されている短縮URLの取扱いがある。短縮URLサービスの提供元が将来無くなった場合,ツイート中のリンク先をどのように把握するかという問題であるが,これに関してLCは対処法の検討を開始している。
ツイートのアーカイブの利活用を決めたのはLCだけではない。2010年4月14日にはGoogleが,Twitterのツイートのアーカイブを利用した新しいサービス“Google Replay”を開始した。これは,あるトピックに関連するツイートを検索し,さらにそれらを時系列に表示できるというものである。つながりを構築するためのツールというサービス本来の意図に加え,時代を映し出す鏡としてのTwitterの役割に注目が集まりつつある。
Ref:
http://www.loc.gov/today/pr/2010/10-081.html
http://blogs.loc.gov/loc/2010/04/how-tweet-it-is-library-acquires-entire-twitter-archive/
http://twitter.com/librarycongress/status/12169442690
http://blog.twitter.com/2010/04/tweet-preservation.html
http://www.libraryjournal.com/article/CA6726233.html
http://www.nytimes.com/2010/04/15/technology/15twitter.html
http://wiredvision.jp/news/201004/2010042122.html
http://googleblog.blogspot.com/2010/04/replay-it-google-search-across-twitter.html
E888