デジタル人文学

米・ブラウン大学デジタル出版イニシアティブ、同大学初のボーンデジタルの学術単行書を米・ヴァージニア大学出版局から出版

2020年7月21日、米・ブラウン大学は、同大学デジタル出版イニシアティブ(Digital Publications Initiative)作成のボーンデジタルの学術単行書“Furnace and Fugue”が、米・ヴァージニア大学出版局から出版されたことを発表しました。

発表によると、同大学にとって初のボーンデジタルの学術単行書であり、テキストと画像、楽譜、音声が含まれています。同出版局は、同書をオープンアクセスで公開する予定としています。

また、同大学では、デジタルでの単行書の出版について、新たな学術的形式の構築および検証が行われています。同イニシアティブは、2021年にボーンデジタルの単行書1冊を米・スタンフォード大学出版局から出版予定であり、アンドリュー・W・メロン財団の助成を受けて、今後6年間で4つから5つの新たなプロジェクトの追加を計画しています。

米・エモリー大学の研究チーム、ジョージア州の大西洋岸約100マイルの生態系・歴史等を参照可能なオンラインリソース“Georgia Coast Atlas”を公開

2020年7月9日、米国のエモリー大学は、ジョージア州大西洋岸の100マイルに及ぶ海岸と防波島における活発な生態系・歴史等を参照可能なオンラインリソースとして、“Georgia Coast Atlas”が利用可能であることを発表しました。

“Georgia Coast Atlas”は同大学の環境科学部とデジタルスカラシップセンターの共同プロジェクトによって構築されました。同大学の学生・教員が作成した同地域のドローンによる空撮映像や、収集された歴史的エピソード、注釈付きの地図などで構成され、現在も継続して収録コンテンツの拡大が進められています。

同大学は、研究・フィールドワーク・情報技術を融合し、自然科学と人文科学の協働による、研究者・一般市民向けの前例のないリソースを構築した、としています。

【イベント】シンポジウム「漢籍デジタル化公開と中国古典小説研究の展開」(8/8・オンライン)

2020年8月8日、東京大学附属図書館アジア研究図書館上廣倫理財団寄付研究部門 (U-PARL)と東京大学アジア研究図書館の主催により、シンポジウム「漢籍デジタル化公開と中国古典小説研究の展開」が、Zoomウェビナーを利用したオンライン形式で開催されます。

当初2020年3月21日に開催を予定し、新型コロナウイルス感染症の状況に鑑み延期となっていた同名の公開シンポジウムを、一部プログラムを変更してオンラインシンポジウムとして開催するものです。

視聴は無料ですが、申し込みフォームによる事前の申し込みが必要です。当日のプログラムは以下のとおりです。

・開会の辞・趣旨説明
上原究一氏 (東京大学 准教授、U-PARL副部門長)

・『水滸伝』版本研究から何がわかるのか―白話文学における校勘の意義
小松謙氏(京都府立大学教授)

・『水滸伝』百二十回本の所在調査と諸本の相違
中原理恵氏(京都大学研修員)

・アジア研究図書館デジタルコンテンツ「水滸伝コレクション」の現状と展望
荒木達雄氏(U-PARL特任研究員)

・デジタル化資料を用いた中国古典小説版本研究
中川諭氏(立正大学教授)

欧州研究図書館協会(LIBER)、テキスト認識処理に関心のある図書館員にとって有用な文献のリストを公開

2020年7月8日、欧州研究図書館協会(LIBER)は、光学文字認識(OCR)・手書きテキスト認識(Handwritten Text Recognition:HTR)といった、テキスト認識処理に関する文献リストを公開したことを発表しました。

LIBERは、テキスト認識処理の詳細、テキスト認識処理分野における新しい動向、品質の低いテキスト認識がデジタルコレクションに与える影響といった話題に関心のある図書館員に有用な文献を紹介する目的でリストを公開しました。LIBERのデジタル人文学・デジタル文化遺産ワーキンググループでは、メンバー宛に有用な文献の推薦を募って文献管理ツールZoteroへの集約を行っており、公開された文献リストは、このZoteroに集約された文献から抜粋されたものです。リストには以下のような文献が含まれています。

・米国のノースイースタン大学の報告書“A Research Agenda for Historical and Multilingual Optical Character Recognition”。印刷テキストや手稿を対象とした歴史的・多言語資料のOCRの品質改善に関する9つの提言などが含まれている。

米・コネチカット大学の図書館と工学部による手書き文字の認識技術開発(記事紹介)

2020年7月9日付で、米国のコネチカット大学が、同大学図書館と同大学工学部による、機械学習を用いた手書き文字の認識技術開発の取組に関する記事を公開しています。

同館が運営するデジタルアーカイブ“Connecticut Digital Archive”では、歴史的資料がオンラインで提供されています。しかし、手稿は光学文字認識(OCR)処理を行えないため、デジタル化後も検索ができない状況であり、米国の図書館等のネットワークLYRASISからの助成を受けて、同館は解決に取り組んでいます。

同館はマサチューセッツ歴史協会や同大学工学部等と協力し、22種類の文字の1万6,000枚以上の画像を2019年の夏に作り、そのパターンを識別するための、ニューラルネットワークを構築するアルゴリズムを作成しました。結果として、22文字すべてを対象とした際には86パーセント、4文字を対象とした際には96パーセント以上の正確さで、文字を認識できたとしています。

取組の目標としては、データセットの拡充、ニューラルネットワークの調整、改良版の一般公開が挙げられています。

英国図書館の消滅の危機に瀕した文化遺産アーカイブプロジェクトEndangered Archives Programme、新たに4コレクションをオンライン公開

2020年7月3日、英国図書館(BL)の消滅の危機に瀕した文化遺産アーカイブプロジェクトEndangered Archives Programme(EAP)は、新たに4つのコレクションがオンライン上で利用可能になったことを発表しました。

EAPが今回公開した4つのコレクションとその概要は以下のとおりです。

・ブラジル第2の文書館であるバイーア州立公文書館から寄託された1664年から1910年までの1,329冊・30万6,416ページに相当する公正証書のコレクション“Notary Books of Bahia, Brazil, 1664-1910”。バイーアは1763年までポルトガル植民地政府において中心的な地位を占めた地域であり、公開された文書類は19世紀末までの同地域の社会経済史の研究において最も信頼のおける情報源である。

米・LYRASIS、資金助成プログラム“Catalyst Fund”の2020年の助成対象プロジェクトを発表

2020年7月6日付の、米国の図書館等のネットワークLYRASISのお知らせで、加盟館による新しい試みや革新的なプロジェクトへの資金助成プログラムとしてLYRASISが実施する“Catalyst Fund”について、2020年の助成対象プロジェクトが発表されています。

“Catalyst Fund”は、LYRASISの研究・開発・イノベーションに関する予算120万ドルの枠内で実施されるプログラムであり、2020年で4年目を迎えます。以下の5件のプロジェクトが2020年の“Catalyst Fund”による資金助成対象として選定されています。

・ユタ大学による、精度の低いOCRにより抽出された歴史的文書のテキストデータ改善を支援するガイドライン・ツール開発のためのプロジェクト“Toolkit to Assess OCR’ed Historical Text in the Era of Big Data”

国立国語研究所、「国語研変体仮名字形データベース」を公開

2020年7月1日、国立国語研究所は、「国語研変体仮名字形データベース」を公開したことを発表しました。

同研究所は公開したデータベースの特長を以下のように紹介しています。

・『春色梅児与美』の巻一・二・三、及び『比翼連理花廼志満台』の初編上・中・下を収録(2020年3月現在)した「字形データベース」から、平仮名・片仮名・漢字・合字・踊り字・その他の字形画像を閲覧可能

・平仮名(変体仮名)を、音価・字母・Unicodeの3階層に分類して表示

・音価・字母・Unicodeの各階層の見出しラベルから、「学術情報交換用変体仮名」ウェブサイトの該当文字(または検索結果)へのリンクを設定

・個々の字形画像から、原資料の該当箇所へのリンクを設定

・「資料一覧」にリストする資料名から、個々の原資料画像の閲覧が可能、また、原資料画像に埋め込んだ翻刻テキストから、「変体仮名字形データベース」の字形一覧へのリンクを設定

欧州研究図書館協会(LIBER)、2019/2020年の年次報告書を公開

2020年6月12日、欧州研究図書館協会(LIBER)は、2019/2020年の年次報告書である“LIBER Europe 2019-2020 Annual Report”のリポジトリZenodo上での公開を発表しました。

LIBERによる年次報告書の公開は、2018/2019年版に続き今回が2度目となります。2019年6月から2020年5月までの主な出来事、2018-2022年の戦略計画の進捗状況、関与した国際的なプロジェクト、年次大会や季刊誌“LIBER Quarterly”に関するデータ、会計状況等が報告されています。

年次報告書公開に関する発表では、対象期間内の主な出来事として、第48回年次大会の開催、同大会でLIBERの運営を持続可能とするための提案が採択されたこと、国際プロジェクト(SSHOC、INOS、 reCreating Europe)での他機関との協力実施、第49回年次大会のオンライン開催決定、ウェビナーを17回開催し計2,500人以上の参加があったこと、LIBERに新たに10機関が参加したことなどを挙げています。

人文学オープンデータ共同利用センター(CODH)、「Unicode変体仮名一覧」を公開

2020年6月11日、人文学オープンデータ共同利用センター(CODH)は「Unicode変体仮名一覧」を公開したことを発表しました。

同一覧は、Unicodeに登録されている変体仮名285文字を現代ひらがなごとにまとめたもので、ひらがなごとに字母を確認できます。ひらがなに張られているリンクを押下すると、「日本古典籍くずし字データセット」に収録されている実際の字形を確認できます。また、変体仮名にマウスポインタ等を合わせると、Unicodeのコードポイントを確認することができます。

ニュース
http://codh.rois.ac.jp/news/
※2020年6月11日付で「Unicode変体仮名一覧」を公開したというお知らせが掲載されています。

Unicode変体仮名一覧
http://codh.rois.ac.jp/char-shape/hentaigana/

ページ