デジタル人文学

凸版印刷株式会社、デジタルアーカイブデータ上に文化情報を蓄積するシステム「オンライン・フィールドワーク・システム(ETOKI)」のプロトタイプを共同開発

2019年8月30日、凸版印刷株式会社はデジタルアーカイブデータ上に文化情報を蓄積するシステム「オンライン・フィールドワーク・システム(ETOKI)」のプロトタイプを京都大学との共同研究の成果により開発したことを発表しました。

2018年から、凸版印刷株式会社と京都大学は次世代文化情報プラットフォーム構想に関する共同研究を進めています。これは屏風絵などの文化財に描かれた内容に関して、地理・歴史・工芸・観光など複数の専門家の見解を、デジタルアーカイブデータ上に情報集約することで、学術研究や文化財鑑賞に役立てることを目的とした共同研究です。今回のシステム開発にあたっては、京都大学総合博物館によって、凸版印刷が持つデジタルアーカイブデータへの名所・建築物・人物に関する描画情報や関連資料など、客観的情報の紐付け作業が行われました。

凸版印刷株式会社は、共同研究の成果物として発表された「オンライン・フィールドワーク・システム(ETOKI)」について、屏風絵などの絵画資料に描かれた町の中を、様々な分野・立場の人々が共にフィールドワーク(絵解き)を行い、デジタルアーカイブデータ上に文化情報を蓄積するシステムであるとしています。

スコットランド国立図書館(NLS)、機械可読なデータで同館コレクションを提供するウェブサイト“Data Foundry”を公開

2019年9月2日、スコットランド国立図書館(NLS)が ウェブサイト“Data Foundry”を公開しました。

デジタルスカラシップサービスの一環として、同館のコレクションを機械可読なデータとして提供することで、コンテンツマイニング・画像分析といったデジタル研究の範囲を拡大することを目的としたサイトです。

現在、テキスト、画像、メタデータなど70GB以上のデータが搭載されており、今後も、サイトの更新に合わせて新たなデータが追加される予定です。

Data Foundry launched(NLS,2019/9/2)
https://www.nls.uk/news/archive/2019/09/data-foundry

Data Foundry
https://data.nls.uk/

【イベント】東北インド・チベット学研究会主催セミナー「人文情報学(Digital Humanities)とインド・チベット文献学」(9/4・仙台)

2019年9月4日、東北大学附属図書館(宮城県仙台市)の本館多目的室において、東北インド・チベット学研究会主催のセミナー「人文情報学(Digital Humanities)とインド・チベット文献学 東北大学附属図書館蔵デルゲ版チベット大蔵経に関する現状と課題について」が開催されます。

入場無料で参加資格は特にありません。また事前予約不要です。

プログラムの内容は次のとおりです。

「東北大学附属図書館における資料電子化と公開の現状」
三角太郎氏(東北大学附属図書館)

「デルゲ版チベット大蔵経についての現状と課題」
菊谷竜太氏(京都大学白眉研究センター)

「コメントならびに質疑応答」
司会:加藤諭氏(東北大学史料館)

お知らせ(東北大学附属図書館)
http://www.library.tohoku.ac.jp/news/news.html
※2019/08/29欄に「【本館】チベット大蔵経に関するセミナーを開催します」とあります。

米・カリフォルニア大学バークレー校、全米人文科学基金(NEH)からの助成により人文学研究者向けにテキスト・データ・マイニングに関わる法的諸問題解決のための支援事業を実施

2019年8月14日、米・カリフォルニア大学バークレー校は、人文学研究者向けにテキスト・データ・マイニングに関わる法的諸問題の解決を支援する同校の事業に対して、全米人文科学基金(NEH)から16万5,000ドルの助成を獲得したことを発表しました。

この事業はカリフォルニア大学バークレー校を中心とした法律専門家・図書館員・研究者のチームによって実施されます。事業の背景として、人文学分野の研究ではテキスト・データ・マイニングという手法がしばしば用いられますが、研究のためのデータセットを用意するには著作権法・契約法・プライバシー法等に関する法的問題をクリアする必要があること、研究者が複雑な法的問題が発生するものを避けてパブリックドメイン等の容易に利用可能な資料を扱いがちで研究対象に偏りが現れる傾向にあることを挙げています。

全米人文科学基金(NEH)、人文学に関する215件のプロジェクトに総額2,900万ドルの助成を実施

2019年8月14日、全米人文科学基金(NEH)は人文学に関する215件のプロジェクトに総額2,900万ドルの助成を実施することを発表しました。

助成されるプロジェクトには、米国南部の食習慣・歴史・文化に関するテレビシリーズを制作する“South by Somewhere”プロジェクト、著名な映画製作者Ric Burns氏によるアラスカの歴史とアイデンティティに関する3部構成のドキュメンタリー製作、進歩主義時代の女性の第一人者に関するアニメ映画シリーズの製作、『オズの魔法使い』や『風と共に去りぬ』のオリジナルネガを含むジョージ・イーストマン博物館の硝酸塩をベースにしたフィルム・写真コレクションの保護などが含まれています。

助成は以下の分野に分類されています。

JSTOR、アラビア語資料のデジタル化に関するホワイトペーパーを公開

2019年8月15日、JSTORはアラビア語資料のデジタル化に関するホワイトペーパー“Digitizing Printed Arabic Journals: Is a Scalable Solution Possible?”の公開を発表しました。

JSTORは、2017年に全米人文科学基金(NEH)の助成を受けて、アラビア語の学術コンテンツをデジタル化するプロセスの研究を行いました。同研究はコスト効率がよく、大規模に実装可能で、高品質の画像、メタデータ、完全に検索可能なテキストを制作可能なアラビア語雑誌をスキャンするワークフローの開発を目標に、2年間のプロジェクトとして実施されています。

公開されたホワイトペーパーでは、JSTORの研究をアラビア語のデジタル化された学術雑誌文献全体の概況の中へ位置づけながら、プロジェクトの取り組みと得られた知見等が記述されています。ホワイトペーパーの結論の中では、アラビア語ジャーナルを高精度でデジタル化することが可能であること、OCRソフトウェア・OCRエンジンへの継続的な投資を行うことでコスト低減が可能であること、などが確証されています。

研究データ同盟(RDA)、デジタル人文学分野の研究者・サービスプロバイダを対象にRDAの関連情報をまとめた報告書を公開

2019年7月30日、研究データ同盟(RDA)が、報告書“The Research Data Alliance and the Humanities”を公開しました。

主に欧州のデジタル人文学分野の研究者・サービスプロバイダを対象に、同分野と関係するRDAの基本的な情報を提供することで、彼らがRDAの成果を享受し、RDAの活動への関与を増大させることを目的に、オランダの学術情報の収集・提供機関であるData Archiving and Networked Services(DANS)が作成した報告書です。

報告書では、RDAの概要、人文学の現状と特殊性、人文学の研究者・実務者・サービスプロバイダに関係するRDAのInterest Group(IG)・Working Group(WG)・提言・成果の観点からRDAが同分野に提供する機会を提供するほか、欧州人文学デジタル研究基盤(DARIAH)や言語分野の研究インフラCLARINとの連携について取り上げています。

【イベント】2019年度KU-ORCAS国際シンポジウム「East Asian Studies and DH」(8/30・大阪)

2019年8月30日、関西大学千里山キャンパス(大阪府吹田市)において、関西大学アジア・オープン・リサーチセンター(KU-ORCAS)の2019年度国際シンポジウム「East Asian Studies and DH」が開催されます。

参加費は無料であり、事前の申込みが必要ですが当日参加も歓迎するとあります。
主なプログラムは次のとおりです。

項潔氏(台湾大学教授)
※2019年8月5日時点では題目の掲載なし

藤田高夫氏(KU-ORCAS)
Analysis of writing styles on wood slips of the Han period

吉田壮氏(KU-ORCAS)
Image analysis for character region extraction from wood slips

菊池信彦氏 (KU-ORCAS)
The KU-ORCAS’s Digital Archives Project for East Asian Studies

くずし字認識に関する全世界的なコンペティションが機械学習コンペプラットフォームKaggleで開催

2019年7月10日、世界最大規模の機械学習コンペプラットフォームKaggleで、くずし字認識に関する全世界的なコンペティション「くずし字認識:千年に及ぶ日本の文字文化への扉を開く」の開催が発表されました。

このコンペティションは、情報・システム研究機構のデータサイエンス共同利用基盤施設に所属する人文学オープンデータ共同利用センター(CODH)、同機構の国立情報学研究所(NII)・人間文化研究機構の国文学研究資料館(国文研)の主催により、2019年7月中旬から10月中旬まで開催されます。

開催の目的として、深層学習(機械学習)の活用を中心とした近年のAIの飛躍的な発展を取り入れることで、新方式のくずし字OCRの研究開発が進む可能性が高まっていることを背景に、くずし字OCRの性能向上に向けたアイデアをオープンに募集することが挙げられています。

コンペティションでは、国文研とCODHが共同整備し公開中の「くずし字データセット」改良版が提供され、コンペ参加者は与えられた画像内に書かれた全てのくずし字を認識して出力する「くずし字OCRアルゴリズム」を期間内に開発するという流れで進められます。上位入賞したアルゴリズムについてはコンペ後自由に使えるよう公開される予定です。

ジャパンサーチ(試験版)、立命館大学アート・リサーチセンター(ARC)の古典籍ポータルデータベースと連携し古典籍資料約16万点が検索可能になる

ジャパンサーチ(試験版)は、2019年7月9日付のTwitterにおいて、立命館大学アート・リサーチセンター(ARC)の「ARC古典籍ポータルデータベース」と連携したことを発表しました。

この連携により、ジャパンサーチ(試験版)では、海外機関の所蔵資料も含め約16万点のウェブ上で公開された古典籍資料が検索可能になっています。

@jpsearch_go(Twitter,2019/7/9)
https://twitter.com/jpsearch_go/status/1148529708167917569

お知らせ(ジャパンサーチ(試験版))
https://jpsearch.go.jp/news
※2019年7月9日付けのお知らせに「「ARC古典籍ポータルデータベース」と連携しました」とあります。

ページ