デジタル人文学

オランダ王立図書館、実験ツールやデータセットを利用できるウェブサイト“KB Lab”をリニューアル

2017年4月11日、オランダ王立図書館(KB)は、“KB Lab”のウェブサイトをリニューアルしたと発表しています。

“KB Lab”のウェブサイトは、デジタルヒューマニティーズの研究者や、デジタル研究に関心がある利用者が、実験ツール及びKBのデジタルコレクションや歴史的資料のポータルサイト“Delpher”を基にしたデータセットを利用できるプラットフォーム(英語)です。

Renewed KB Lab website live(KB,2017/4/11)
https://www.kb.nl/en/news/2017/renewed-kb-lab-website-live

KB Lab(KB)
http://lab.kb.nl/

米国図書館協会、米国図書館界の概況についての報告書 (2017年版)及び「2016年に最も批判を受けた図書」を公表

2017年4月10日、米国図書館協会(ALA)が、全米図書館週間にあわせ、米国図書館界の概況をまとめた報告書“State Of America's Libraries Report”の2017年版を公表しています。

報告書では、図書館が、(1)あらゆる種類の情報を質の評価に必要な知識や訓練を利用者に提供していること、(2)幼児のリテラシー・コンピュータスキル・労働力開発支援に大きな役割を果たしていること、(3)資料・プログラム・サービスにコミュニティの多様性を反映させることで住民にとって安全な場所を提供していること、を示しています。

その他、館種別では

・大学図書館
学術コミュニケーション、デジタルアーカイブス、データキュレーション、デジタルヒューマニティーズ、可視化、ボーンデジタルの分野で新しい役割を担いつつある。新興領域として、計量書誌学、オルトメトリクス、e-Learning、custom information solutions、研究データ管理がある。

人文学オープンデータ共同利用センター、正式発足

2016年4月1日付けで準備室が情報・システム研究機構・データサイエンス共同利用基盤施設に開設されていた人文学オープンデータ共同利用センターについて、2017年4月1日より正式に発足しました。センター長は準備室長から引き続き北本朝展氏(国立情報学研究所)が務めるとのことです。

センターの概要(人文学オープンデータ共同利用センター)
http://codh.rois.ac.jp/about/

人文学オープンデータ共同利用センターが「正式に」誕生(笠間書院online、2017/4/2付け)
http://kasamashoin.jp/2017/04/post_3915.html

参考:
情報・システム研究機構、人文学オープンデータ共同利用センター準備室を開設
Posted 2016年4月25日
http://current.ndl.go.jp/node/31435

国立歴史民俗博物館、「近世職人画像データベース」を公開

国立歴史民俗博物館が、2017年3月17日に「近世職人画像データベース」を公開したと発表しています。

17世紀から19世紀にわたる近世(江戸時代)の日本で商業出版された版本(板本)27タイトル(29種)の挿絵から、「職人」(諸職)の描かれた約3,000の画像を抜き出して、様々な角度から検索できるようにしたものです。

国文学研究資料館・国立歴史民俗博物館の研究者を中心に活動した連携研究「都市風俗と「職人」-日本中近世の絵画資料を中心に-」(平成25~27年度)の成果です。

データベース お知らせ(国立歴史民俗博物館)
http://www.rekihaku.ac.jp/doc/t-db-index.html
※「2017/03/17 下記のデータベースを新規公開しましたので、是非ご利用ください。 ・近世職人画像」とあります。

英国図書館、インドの貴重書や冊子体目録の自動テキスト化を目的としたコンペティションを開催

2017年3月22日、英国図書館(BL)が、同館の“Two Centuries of Indian Print”プロジェクトで現在デジタル化中のインドの貴重書や冊子体目録の、正確で自動でのテキスト化の方法を見つける事を目的としたコンペティションを開催すると発表しています。

米・スタンフォード大学のPRIMA Research Labと連携し、2017年11月10日から15日にかけて京都で開催される第14回文書解析・理解国際会議(International Conference on Document Analysis and Recognition:ICDAR)において行なうもので、優勝者は会議中に発表されるとのことです。

課題は2つあり、1つ目は、ベンガル語で書かれた19世紀の印刷本の自動テキスト化で、2つ目は、1867年から1967年までにインドで出版された図書が出版地や価格とともに記載されている“Quarterly Lists”と呼ばれる冊子体目録の自動テキスト化です。

画像を解析して類似する文字画像を表示する「木簡・くずし字解読システム―MOJIZO―」のスマホ・タブレット版が公開

2017年3月17日、奈良文化財研究所と東京大学史料編纂所が、画像を解析して類似する文字画像を表示する「木簡・くずし字解読システム―MOJIZO―」のスマホ・タブレット版を公開したと発表しています。

レスポンシブウェブデザインに対応したもので、あわせて、韓国語、中国語(簡体字・繁体字版)、英語による利用方法や凡例などのpdfファイルをトップ画面に掲載したとのことです。

「木簡・くずし字解読システム-MOJIZO-」スマホ・タブレット版の公開および外国語案内の追加に関するお知らせ(奈良文化財研究所,2017/3/17)
http://hdl.handle.net/11177/6283

木簡・くずし字解読システム-MOJIZO-
http://mojizo.nabunken.go.jp/

国立国語研究所、「国語研日本語ウェブコーパス」の検索系「梵天」を一般公開

2017年3月7日、国立国語研究所(国語研)が、「国語研日本語ウェブコーパス」の検索系「梵天」を一般公開しました。

「国語研日本語ウェブコーパス」は、ウェブ(WWW)上の日本語テキストを利用して現代日本語コーパスを構築したもので、稀言語現象の言語学的、心理学的および情報処理的視点からの究明の可能性を開くことを目的としており、検索系「梵天」に格納して公開されました。

一般公開版の利用者は、文字列検索のみが可能で、インデックス情報のダウンロードなどはできないほか、利用規約に同意する必要があります。

その他、高機能版もあり、品詞列検索・係り受け検索が利用でき、インデックス情報などがダウンロードできますが、利用するためには、利用規約への同意、書籍やブログなどから抽出した1億語の現代日本語コーパスを検索できる「中納言」のアカウントの保持と半年以上の利用経験、国語研が開催する「梵天」講習会への参加、が必要です。

富士通、教師データ数を削減できる深層学習技術を開発、中国古文書の文字認識において学習用の教師データを削減

2017年2月21日、富士通研究開発中心有限公司は、中国古文書文字の文字認識に用いる深層学習技術において、少ない数の学習データでも高精度な文字認識を実現できる技術を開発しました。

この技術により、図書館などに大量に保管されている古文書文字の電子化を促進し、中国古文書の公共利用と歴史研究などの学術の発展に貢献することができるとのことです。

教師データ数を削減できる深層学習技術を開発
中国古文書の文字認識において学習用の教師データを70%削減(富士通株式会社、2017/2/21)
http://pr.fujitsu.com/jp/news/2017/02/21.html

欧州研究図書館協会、デジタル・ヒューマニティーズに関するワーキンググループを立ち上げ

2017年2月3日、欧州研究図書館協会(LIBER)が、デジタル・ヒューマニティーズに関するワーキンググループ(WG)を立ち上げたことを発表し、参加を呼びかけています。

LIBERでは、デジタル・ヒューマニティーズにおいて、図書館が中心的役割を果たすと、2018-2022年の戦略方針案で言及しており、WGでは、2年間の活動の中で、欧州でのデジタル・ヒューマニティーズについての図書館の知識ネットワークの構築に焦点をあて、欧州の研究図書館とデジタル・ヒューマニティーズとの関係を強化することを目指しています。

芸術・人文諸科学のための電子研究インフラ構築プロジェクトDARIAH(Digital Research Infrastructure for the Arts and the Humanities)内にも、対応するWGが設置される予定で、お互いに連携・協力する計画になっています。

LIBER Launches Digital Humanities Working Group(LIBER,2017/2/3)
http://libereurope.eu/blog/2017/02/03/liber-launches-digital-humanities-working-group/

DARIAH
http://www.dariah.eu/

参考:

【イベント】第2回CODHセミナー くずし字チャレンジ 〜機械の認識と人間の翻刻の未来〜(2/10・東京)

2017年2月10日、国立情報学研究所(NII)で、第2回CODHセミナー「くずし字チャレンジ 〜機械の認識と人間の翻刻の未来〜」が開催されます。

くずし字を読むというチャレンジに対して機械によるアプローチと人間によるアプローチを用いた研究について、研究者がこれまでの研究の紹介と今後の展望について語ります。

参加費は無料、定員は約40名です。事前の申込が必要です。

13:00-13:25
NIJL-NWプロジェクト―くずし字読解への課題と期待
山本 和明、国文学研究資料館

13:25-13:50
日本古典籍字形データセットの公開と活用への期待
北本 朝展、人文学オープンデータ共同利用センター/国立情報学研究所

13:50-14:15
電子くずし字字典データベースにおける現状と展望
山田 太造、東京大学史料編纂所

14:15-14:40
木簡文字への文字認識技術の応用
耒代 誠仁、桜美林大学

14:40-15:05
くずし字の学習支援と市民参加翻刻
橋本 雄太、京都大学

15:05-15:20
全体討論
全員

第2回CODHセミナー くずし字チャレンジ 〜機械の認識と人間の翻刻の未来〜(CODH)

ページ