人文学オープンデータ共同利用センター(CODH)、「篆書字体データセット」を公開

2021年3月31日、人文学オープンデータ共同利用センター(CODH)が、「篆書字体データセット」の公開を発表しました。

IIIFで公開されている字書・字彙類に記された篆書字体画像の、所在情報とメタデータがまとめられています。発表時点でのデータ規模は、ハーバード大学図書館の“HOLLIS”で公開されている『金石韻府』をはじめとした、7点の資料画像から抽出された篆書体7,681文字種の文字画像データ10万6,447文字です。

データセットは、クリエイティブ・コモンズ・ライセンスのCC BY-SAで提供されています。

ニュース(CODH)
http://codh.rois.ac.jp/news/
※2021年3月31日付で、「篆書字体データセット」の公開に関するお知らせが掲載されています。

篆書字体データセット(CODH)
http://codh.rois.ac.jp/tensho/

参考:
人文学オープンデータ共同利用センター(CODH)、MNISTデータセット互換のくずし字データセットKMNISTを公開
Posted 2018年12月10日
https://current.ndl.go.jp/node/37192

人文学オープンデータ共同利用センター(CODH)、日本古典籍くずし字データセットに字形データを大幅に追加:データセットを活用した無料のAIくずし字OCRサービスも公開
Posted 2019年11月12日
https://current.ndl.go.jp/node/39489