古典

富士通、教師データ数を削減できる深層学習技術を開発、中国古文書の文字認識において学習用の教師データを削減

2017年2月21日、富士通研究開発中心有限公司は、中国古文書文字の文字認識に用いる深層学習技術において、少ない数の学習データでも高精度な文字認識を実現できる技術を開発しました。

この技術により、図書館などに大量に保管されている古文書文字の電子化を促進し、中国古文書の公共利用と歴史研究などの学術の発展に貢献することができるとのことです。

教師データ数を削減できる深層学習技術を開発
中国古文書の文字認識において学習用の教師データを70%削減(富士通株式会社、2017/2/21)
http://pr.fujitsu.com/jp/news/2017/02/21.html

【イベント】一橋大学、シンポジウム「書物の構成要素としての紙について~本の分析学」を開催(2/15・東京)

2017年2月15日、一橋大学社会科学古典資料センター及び一橋大学附属図書館が、平成28年度文化的・学術的資料の保存シンポジウム「書物の構成要素としての紙について~本の分析学」を開催します。これは、文部科学省共通政策課題「文化的・学術的な資料等の保存等」概算事業として採択された「西洋古典資料の保存に関する拠点およびネットワーク形成事業」(2016年度から2018年度まで)の一環として開催するものです。国立大学図書館協会東京地区協会が後援しています。

内容は次のとおりです。

講演
「洋書の紙質と本の寿命について」吉川也志保氏(一橋大学言語社会研究科特別研究員)
「洋紙の原材料を観察する」宍倉佐敏氏(女子美術大学特別招聘教授)
「『モノ』が持つ情報とその保全~科学・技術の限界~」加藤雅人氏(東京文化財研究所文化遺産国際センター国際情報研究室長)

全体討論・質疑応答
コーディネーター 江夏由樹氏(帝京大学教授・一橋大学名誉教授)

参加は無料です。定員は50名で、申込みが必要ですが、席に余裕があれば当日参加も可能とされています。

講演会(一橋大学社会科学古典資料センター)
http://chssl.lib.hit-u.ac.jp/education/lecture.html

米国国立医学図書館、インキュナブラ及び第二次世界大戦関係の政府文書のデジタルコレクションを公開

2017年1月11日、米国国立医学図書館(NLM)が、デジタルコレクション2件をインターネットで公開したと発表しています。

公開された2件は、科学や医学に関する、同館が所蔵する580点以上のインキュナブラの内、40点を超す世界的に有名なコレクションを含む“Incunabula: A collection of books and broadsides printed in Europe before 1501”と、政府・軍人・医療従事者・科学者が第二次世界大戦中や、その後に国内外で行った取り組みを示す、連邦、州、地方政府が作成した報告書、応急処置マニュアル、パンフレット、採用関連資料などの刊行物1,500点以上を含む“World War 2, 1939-1949: A collection of U.S. government documents”です。

NLM Announces Two New Digital Collections: Incunabula & World War II U.S. Government Documents(NLM,2017/1/11)
https://www.nlm.nih.gov/news/incunabula_ww2_gov.html

韓国国立中央図書館、古書10点16冊を新たに貴重本に指定:日本語語彙集「倭語類解」や朝鮮通信使の使行録「溟槎録」など

2016年12月27日、韓国国立中央図書館(NLK)が、所蔵する古書のなかから、10点16冊を新たに貴重本に指定したと発表しています。

今回指定された貴重本のなかには、18世紀の訳官・洪舜明が編纂し司訳院で使用された日本語語彙集「倭語類解」や、朝鮮通信使の使行録「溟槎録」が含まれています。

18c초 군사지도‘영고탑도’등 10종 16책 고서 귀중본 신규 지정(NLK,2016/12/27)
http://www.nl.go.kr/nl/commu/libnews/article_view.jsp?board_no=8893&site_code=nl&notice_type_code=3&currentPage=0&srch=&searchWord=&cate_no=0

「日本語の歴史的典籍の国際共同研究ネットワーク構築計画」、2015年度の拠点デジタル化資料として、拠点9大学分のデジタル化画像を公開

国文学研究資料館が中心となって、「日本語の歴史的典籍」をキーワードに、国際的な共同研究ネットワークの構築へ向けて行なっているプロジェクト「日本語の歴史的典籍の国際共同研究ネットワーク構築計画」が、2016年12月22日、拠点20大学のうち、9大学分(北海道大学、東京大学、お茶の水女子大学、名古屋大学、大阪大学、京都大学、奈良女子大学、慶應義塾大学、関西大学)のデジタル化画像を公開したと発表しています。

2017年4月には新たな画像データベースが公開される予定で、以降は、その新データベースから拠点大学の画像を公開するとのことです。

拠点大学の画像公開について 【2015(平成27)年度の拠点デジタル化資料 】(国文学研究資料館,2016/12/22)
http://www.nijl.ac.jp/pages/cijproject/database.html

貴重書画像(適塾,懐徳堂)を公開しました(国文学研究資料館「歴史的典籍に関する大型プロジェクト」)(大阪大学附属図書館,2016/12/22)
http://www.library.osaka-u.ac.jp/news/20161222_common.php

参考:
E1754 - 国文研「歴史的典籍オープンデータワークショップ」<報告>

E1872 - 筑波大学附属図書館における二宮文庫の受入れと活用の取組

筑波大学附属図書館は,2006年に亡くなった歴史学者の二宮宏之氏の旧蔵書を二宮文庫として公開した。これは二宮氏の没後に立川孝一筑波大学教授(フランス史・肩書きはいずれも当時)の仲介によって,約9,000冊の旧蔵書が同館へ寄贈され,2016年9月に受入作業が終了したものである。二宮氏は戦後日本を代表する歴史学者であり,特にフランスを対象とした社会史の研究で多くの歴史家に影響を与えている。...

国立情報学研究所と国文学研究資料館、「江戸料理レシピデータセット」を公開

2016年11月24日、国立情報学研究所(NII)と国文学研究資料館が、江戸時代の料理本に書かれた調理手順をデジタル化し、現代の人々でも使える形式に整備した「江戸料理レシピデータセット」を公開したと発表しています。

また、現代語訳、原題の「レシピ」形式に編集したデータを、料理レシピ・検索サービス「クックパッド」でも公開しています。

江戸の文化を現代に取り込む「江戸料理レシピデータセット」を整備~江戸時代の料理本を「レシピ化」し、クックパッドでも公開~(NII,2016/11/24)
http://www.nii.ac.jp/news/2016/1124/

《プレスリリース》「江戸料理レシピデータセット」を公開しました。(国文学研究資料館,2016/11/24)
http://www.nijl.ac.jp/pages/cijproject/images/20161124_news.pdf

江戸料理レシピデータセット(人文学オープンデータ共同利用センター準備室)
http://codh.rois.ac.jp/edo-cooking/

クックパッド江戸ご飯
http://cookpad.com/recipe/list/14604664

参考:
国文学研究資料館、日本古典籍字形データセットを公開
Posted 2016年11月18日

国文学研究資料館、日本古典籍字形データセットを公開

2016年11月17日、国文学研究資料館が、日本古典籍字形データセットを公開しています。

デジタル撮影された同館所蔵の古典籍(料理本8作品分)を翻刻する過程で生まれたくずし字文字86,176文字分の情報等を、オープンデータセットとして、人文学オープンデータ共同利用センター(準備室)から公開するもので、1文字づつの画像、文字座標データなどを1セットにして、クリエイティブ・コモンズ・ライセンスのCC BY-SAで提供されています。

2016年度中には約40万字に規模を拡大する計画です。

《プレスリリース》「日本古典籍字形データセット」8万字を公開しました。(国文学研究資料館,2016/11/17)
http://www.nijl.ac.jp/pages/cijproject/images/20161117_news.pdf

江戸時代の文字の字形データセットを国文研との協働で構築/機械と人間の学習のためのオープンデータとして公開(国立情報学研究所,2016/11/17)
http://www.nii.ac.jp/news/2016/1117-1/

日本古典籍字形データセット(人文学オープンデータ共同利用センター(準備室))
http://codh.rois.ac.jp/char-shape/

参考:

国文学研究資料館、日本古典籍データセットを公開

2016年11月10日、国文学研究資料館は、昨年オープンデータとして公開した古典籍350点分の画像データに、新たに350点分を追加した計700点の古典籍の画像データ等を「日本古典籍データセット」として、人文学オープンデータ共同利用センターのウェブサイトで、クリエイティブ・コモンズ・ライセンスのCC BY-SAで公開しました。

700作品の画像データ約16万コマとその書誌データからなり、作品紹介や翻刻テキストデータ、タグ情報が付いているものもあります。

今後、古典籍に書かれたくずし字などの1文字ずつの画像と文字情報をセットにした字形データセット約8万字分も、一般公開の予定で、2016年12月9日には、同館において、古典籍画像の利活用を考える、「歴史的典籍オープンデータワークショップ(アイデアソン)」を開催するとのことです。

のぞき見しません?・・・古典の世界!日本古典籍データセット700点 大公開(国文学研究資料館,2016/11/10)
https://www.nijl.ac.jp/pages/cijproject/images/20161110_news.pdf

「日本古典籍データセット」公開で国文研と協働/国内研究機関のオープンデータの取り組みを支援・推進(NII、2016/11/10)

中国国家図書館、中国の古籍に関する2つのデータベースを公開

2016年9月28日、中国国家図書館(NLC)が、データベース「全国古籍普查登记基本数据库」「中华古籍资源库」を公開しています。

「全国古籍普查登记基本数据库」はNLCが2012年から実施した中国全土で現存する古籍の調査結果をもとに作成された目録で、13州の96の機関が所蔵する38万タイトル・約350万冊のデータが公開されています。今後、調査の進展とともに内容が更新されます。

「中华古籍资源库」は、デジタル化された古籍を閲覧できる電子図書館で、閲覧には利用者登録が必要です。デジタル化された善本1万タイトル・610万ページの閲覧が可能で、2016年末までには、第2弾として、約6,200タイトルの画像が追加され、2017年末までには、2万3千タイトルの古籍が公開される予定です。

“全国古籍普查登记基本数据库”“中华古籍资源库”正式发布(NLC,2016/9/28)
http://www.nlc.cn/pcab/zx/xw/201609/t20160928_131010.htm

National Library of China launches digital database of ancient books(中国文化,2016/9/30)
http://en.chinaculture.org/2016-09/30/content_883359.htm

ページ