Europeana Proの2021年4月6日付け記事で、Europeanaが取り組む画像分類パイロットプロジェクトの内容が紹介されています。筆者はEuropeana財団の機械学習エンジニアであるJosé Eduardo Cejudo Grano de Oro氏です。
Europeanaでは、パートナー機関から提供されたメタデータに付加価値を与えること(エンリッチメント)により、コレクションの検索・閲覧・推薦といった機能の向上に取り組んでいます。Europeanaの2020年から2025年にかけての戦略“Europeana strategy 2020-2025: Empowering digital change”でも、機械学習によるメタデータの自動エンリッチメントを目標の一つとしています。
本記事では、画像分類パイロットプロジェクトのうち、分類のための語彙の定義、Europeana Search APIを利用した注釈付きデータセット作成のプロセスを取り上げています。また、使用語彙、作成されたデータセット、データセット及び画像分類モデル作成のためのコードを、GitHub上で公開していることも紹介しています。
Introducing our image classification pilot(Europeana Pro, 2021/4/6)
https://pro.europeana.eu/post/introducing-our-image-classification-pilot
europeana/rd-img-classification-pilot(GitHub)
https://github.com/europeana/rd-img-classification-pilot
参考:
E2278 – Europeanaの2020年から2025年の戦略:デジタル変革に力を
カレントアウェアネス-E No.394 2020.07.09
https://current.ndl.go.jp/e2278