英国図書館(BL)、2015年における“.uk”ドメインのウェブサイトの収集を開始

2015年9月2日、英国図書館(BL)が、来週にかけて、2015年における“.uk”ドメインのウェブサイトの収集を実施すると発表しています。

2013年と2014年の収集の概要もあわせて以下のように例示されています。

2013年
・起点URL 380万
・データ  31TB
・ページ数 19億ページ など

2014年
・起点URL 2,000万
・Geo IPでチェックした英国内でホスティングしているウェブサイトの起点URL 250万
・データ  56TB
・ページ数 25億ページ
・4.7GBのウィルスと3.2TBのスクリーンショット

2015 UK Domain Crawl has started(BL UK Web Archive blog,2015/9/2)
http://britishlibrary.typepad.co.uk/webarchive/2015/09/2015-uk-domain-crawl-has-started.html

参考:
CA1467 – Domain.uk―英国のウェブ・アーカイビング― / 河合美穂
カレントアウェアネス No.273 2002.09.20
http://current.ndl.go.jp/ca1467