「日本古典籍データセット」「日本古典籍くずし字データセット」の収録データが拡充

2019年1月30日、「日本古典籍データセット」「日本古典籍くずし字データセット」の収録データが拡充されたことが発表されています。

「日本古典籍データセット」は、国文学研究資料館所蔵の重要文化財『春日懐紙』を含め、点数が1,767点から3,126点、コマ数が32万9,702コマから60万9,631コマへと約1.8倍増加しました。

また「日本古典籍くずし字データセット」も、国立国語研究所・味の素食の文化センター所蔵資料を含む13作品を追加することで、文字種が3,999種から4,645種、文字数が40万3,242点から68万4,165点へと約1.7倍増加しました。

日本古典籍データセット(人文学オープンデータ共同利用センター)
http://codh.rois.ac.jp/pmjt/
※更新情報欄に「2019-01-30 日本古典籍データセットに書籍データを追加し、点数が1,767→3,126、コマ数が329,702→609,631(約1.8倍)に増えました。」とあります。

日本古典籍くずし字データセット(人文学オープンデータ共同利用センター)
http://codh.rois.ac.jp/char-shape/
※更新情報欄に「2019-01-30 日本古典籍くずし字データセットに字形データを追加し、文字種が3,999→4,645、文字数が403,242→684,165(約1.7倍)に増えました。」とあります。

日本語の歴史的典籍の国際共同研究ネットワーク構築計画(国文学研究資料館)
https://www.nijl.ac.jp/pages/cijproject/
※お知らせ欄に「2019年1月30日 オープンデータセットを拡充しました。
古典籍の全冊画像を作品まるごとダウンロードできる「日本古典籍データセット」を、人文学オープンデータ共同利用センター(CODH)の協力のもと、1767点から3126点に大幅に拡充し、重要文化財の『春日懐紙』をはじめとする当館所蔵の貴重書を一挙公開しました。また、同時にくずし字認識の機械学習等に活用されている「日本古典籍くずし字データセット」も、国立国語研究所、味の素食の文化センター所蔵資料を含む13作品を追加し、収載文字数を403,242文字から684,165文字に増やしました。」とあります。

参考:
「日本古典籍データセット」、収録点数を2倍以上に拡充:ビューアーの機能も向上
Posted 2017年12月27日
http://current.ndl.go.jp/node/35245

国文学研究資料館、日本古典籍字形データセットを公開
Posted 2016年11月18日
http://current.ndl.go.jp/node/32951

国文学研究資料館、日本古典籍データセットを公開
Posted 2016年11月10日
http://current.ndl.go.jp/node/32913