国文学研究資料館、日本古典籍字形データセットを公開

2016年11月17日、国文学研究資料館が、日本古典籍字形データセットを公開しています。

デジタル撮影された同館所蔵の古典籍(料理本8作品分)を翻刻する過程で生まれたくずし字文字86,176文字分の情報等を、オープンデータセットとして、人文学オープンデータ共同利用センター(準備室)から公開するもので、1文字づつの画像、文字座標データなどを1セットにして、クリエイティブ・コモンズ・ライセンスのCC BY-SAで提供されています。

2016年度中には約40万字に規模を拡大する計画です。

《プレスリリース》「日本古典籍字形データセット」8万字を公開しました。(国文学研究資料館,2016/11/17)
http://www.nijl.ac.jp/pages/cijproject/images/20161117_news.pdf

江戸時代の文字の字形データセットを国文研との協働で構築/機械と人間の学習のためのオープンデータとして公開(国立情報学研究所,2016/11/17)
http://www.nii.ac.jp/news/2016/1117-1/

日本古典籍字形データセット(人文学オープンデータ共同利用センター(準備室))
http://codh.rois.ac.jp/char-shape/

参考:
国文学研究資料館、日本古典籍データセットを公開
Posted 2016年11月10日
http://current.ndl.go.jp/node/32913