東京大学総合図書館、「デジタル源氏物語(AI画像検索版)」の公開を発表

2021年4月27日、東京大学総合図書館が、「デジタル源氏物語(AI画像検索版)」の公開を発表しました。

国立国会図書館デジタルコレクションで公開されている『校異源氏物語』を基に、複数の写本・版本の全冊画像を横断的に検索できる機能です。検索対象は、各機関が公開している『源氏物語』へのリンクをまとめた「IIIF対応源氏物語リスト」の内、パブリックドメインか自由利用可能として公開されているものや、所蔵機関の許諾を得られたものです。

検索結果として提示される複数の候補画像から、類似度や人文学オープンデータ共同利用センター(CODH)が開発したくずし字OCRによる翻刻を参考に、利用者自身が必要な画像を選択する仕組みです。なお、類似度は、『校異源氏物語』の本文と、くずし字OCRによる諸本翻刻を照合し算出されています。

@UTokyo_GenLib(Twitter, 2021/4/27)
https://twitter.com/UTokyo_GenLib/status/1386933140283822080

デジタル源氏物語(AI画像検索版)
https://genji-ai.web.app/

AI画像検索版について(デジタル源氏物語)
https://genji-ai.web.app/about/

IIIF対応源氏物語リスト(デジタル源氏物語)
https://genji.dl.itc.u-tokyo.ac.jp/list/

参考:
東京大学総合図書館、『源氏物語』の写本をオンラインで公開:「東京大学本」「東大本」ともいわれる貴重図書
Posted 2019年6月6日
https://current.ndl.go.jp/node/38300

人文学オープンデータ共同利用センター(CODH)、日本古典籍くずし字データセットに字形データを大幅に追加:データセットを活用した無料のAIくずし字OCRサービスも公開
Posted 2019年11月12日
https://current.ndl.go.jp/node/39489