Internet Archive(IA)、100万枚以上のアルバムのカバー画像を提供

Internet Archive(IA)が、100万枚以上のアルバムのカバー画像を提供しています。

これはコレクションのデータを利用してもらうためにIAが実験的に抽出したもので、データのキュレーションや品質の確認、重複の削除などは行われていません。

このデータセットにはjpg、png、gifの各形式のファイルが含まれ、サイズは合計で148GBに及びます。データセットの提供はtar形式で行なわれており、ファイル名の頭文字ごとにアーカイブファイルが作成されています。小さいものでは、292MBのアーカイブファイルがあります。

このデータセットは画像処理などでの研究利用が想定されており、アルバム認識ソフト、顔・テキスト認識、カバーの配色の分析などの研究が期待されています。

Experiment with One Million Album Covers(IA, 2015/5/27)
https://blog.archive.org/2015/05/27/experiment-with-one-million-album-covers/

One Million Audio Cover Images for Research(IA, 2014/11/13)
https://archive.org/details/audio-covers