2017年5月23日、国立情報学研究所(NII)はSansan株式会社と提供し、同社の所有する名刺情報のサンプルデータを「Sansanデータセット」として研究用に無償提供することを発表しました。
同データに含まれるのはSansan株式会社が2016年に開催したデータサイエンティスト向け分析コンテストで使用した、サンプル名刺をスキャンした画像データ3841枚分とのことです。いずれも架空の名刺であり、特定の企業や個人につながる情報や人物を特定できる個人情報は一切含まれていないとされています。データはNIIの情報学研究データリポジトリ(IDR)を通じて提供されます。
「サンプル名刺データ」を研究用データセットとして無償提供開始(NII ニュースリリース、2017/5/23付け)
http://www.nii.ac.jp/news/release/2017/0523.html
Sansanデータセット(情報学研究データリポジトリ)
http://www.nii.ac.jp/dsc/idr/sansan/sansan.html
NIIとSansan社、「サンプル名刺データ」を研究用データセットとして無償提供開始(STI Updates、2017/5/25付け)
http://jipsti.jst.go.jp/johokanri/sti_updates/?id=9735
参考:
E1755 – 国立情報学研究所におけるデータセット共同利用の取組
カレントアウェアネス-E No.296 2016.01.21
http://current.ndl.go.jp/e1755