人工知能

ルクセンブルク国立図書館(BnL)、新たなOCRソフトウェアを公開

2021年7月26日、ルクセンブルク国立図書館(BnL)が、人工知能(AI)を活用した、新たなOCRソフトウェア“Nautilus-OCR”をGitHubで公開したと発表しました。

同館は、2006年から光学文字認識(OCR)を利用した歴史的な新聞のデジタル化を行っていますが、紙や印刷の品質・経年劣化等により、文字を正確に認識できなかったと述べられています。今回公開されたソフトウェアは、AIを用いた課題解決を推進する政府のイニシアチブAI4GOVの支援のもと、同館により開発が行われました。

発表によると、“Nautilus-OCR”は、METS/ALTO形式のOCR結果の質向上や通常のOCRエンジンとして利用でき、行の自動特定、フォントの分類、精度向上の予測等のモジュールが含まれています。その他、パブリックドメインの新聞記事を基にした、手書き文字のOCRデータセットや、機械学習モデルも公開されています。オープンソースライセンス“GNU General Public License(GPL)”のバージョン3で提供されています。

フィンランド・ヘルシンキ中央図書館(Oodi)、お薦めの図書を紹介するモバイルアプリObottiを公開:分野の異なるボットから選択可能

2021年6月16日、フィンランド・ヘルシンキ中央図書館(Oodi)が、お薦めの図書を紹介するモバイルアプリObottiの公開を発表しています。

人工知能(AI)を活用したモバイルアプリで、以下のような分野ごとのボットがあり、自分の好みに基づいてボットを選択すると、ボットの好みや自身の選択に基づいて、利用者の好みにあった図書を推薦してくれます。インタラクティブなものとなっており、ボットを学習させることもできます。

・グーテンベルク:利用者の選択に適応するためのOodiの共同ボット。

・レノン:持続可能でロックなライフスタイルに最も適している。

・ヴェルヌ:異なる現実への旅に連れて行く。

・デュード:料理の楽しさや美意識を味わう。

・トーベ:できれば自宅から出ずに、海でも山ででも冒険したい。

・スカーレット:ドラマチックな感情にふけるのが好き。

フィンランド語・スウェーデン語・英語で利用でき、子供向け・若者向けの図書が推薦されるように設定することもできます。

【イベント】第15回CODHセミナー「IIIFとAIで変わる美術史研究 - 大規模顔貌データの様式分析から読み解く日本中世絵巻」 (7/29・オンライン)

2021年7月29日、第15回CODHセミナー「IIIFとAIで変わる美術史研究 - 大規模顔貌データの様式分析から読み解く日本中世絵巻」がオンラインで開催されます。

美術史における基本的な研究手法である顔貌表現の比較による様式分析は、IIIFの普及・「顔貌コレクション(顔コレ)」といったオープンデータの公開・人工知能(AI)の活用により、近年、大規模化のための環境が整ってきていることから、それらを活用して「遊行上人縁起絵巻」(清浄光寺甲本、遊行寺宝物館蔵)の研究を行っているCODHと東京大学のチームが、活用した手法やツールを紹介するとともに、美術史をはじめとする画像を活用した人文学研究を大規模化するための知見を共有することを目的に開催されます。

主な内容は以下の通りで、参加費は無料ですが事前の申し込みが必要です。

・美術史におけるデータ駆動型人文学研究の展開 - IIIFやAIでどう変わるか?
北本朝展氏(ROIS-DS人文学オープンデータ共同利用センター/国立情報学研究所)

・「顔貌コレクション」 IIIF Curation Platformを活用した研究基盤の構築と展開
鈴木親彦氏(ROIS-DS人文学オープンデータ共同利用センター/国立情報学研究所)

Gallicaの画像検索ツールGallicaPix(記事紹介)

2021年6月21日付で、フランス国立図書館(BnF)の電子図書館“Gallica”が、画像検索ツールである“GallicaPix”を紹介する記事をブログに掲載しました。

人工知能、光学文字認識(OCR)、資料の構造を光学的に認識する技術を用いたツールであると述べられています。また、記事では、人や物をはじめとした画像を構成する要素である「コンセプト(Concepts)」や、測色を活用した検索機能による探索方法の他、現在提供されているコーパスとして以下の5つが紹介されています。

・14-18
第一次世界大戦に関するものを中心に、約22万件の多様な画像で構成されています。

・Publicités 14-18
1910年から1920年にかけての広告の画像6万5,000件以上で構成されています。

・Papiers peints et textiles
英国国立公文書館(TNA)とGallicaの連携の成果であり、壁紙や織物の画像3,700件ほどが提供されています。

・Vogue
雑誌“Vogue”のフランス語版の1920年から1940年に刊行された号に掲載された画像で構成されています。

E2396 - 持続可能な図書館サービス「リモートライブラリー+事業」

  別府市(大分県)では,2019年度末に基本理念として,「ひとりひとりの暮らしと創造のよりどころへ」と掲げる新図書館等整備基本計画を取りまとめ,2023年度の開館を目指して事業を進める予定であった。この計画では,目指す図書館像のひとつとして,多種多様な関心を引き出す入り口となり,世代を超えた幅広い人たちが関わる接点やしかけによってさまざまな人や活動に出会い,地域の課題を解決できるコミュニティの場となることを重視していた。

Project MUSE、AIを活用した関連コンテンツ推薦機能を実装:UNSILO社との提携により実現

2021年6月21日、人文・社会科学系の電子資料提供サービスProject MUSEは、人工知能(AI)を活用した関連コンテンツの推薦機能を、同サービスのコレクションに実装したことを発表しました。

今回の実装は、Cactus Communications傘下の企業で、出版社に対しAI技術によるソリューションの提供を行っているUNSILO社との提携を通じ実現されたものです。UNSILO社の Recommender APIは、選択されたドキュメント(書籍の章や学術誌の論文)に対して、Project MUSEのコンテンツコーパスの中から、関連コンテンツへのリンクを自動的に特定します。

発表には、Project MUSEのディレクターであるWendy Queen氏のコメントも掲載されています。同氏は、UNSILO社が提供する推薦機能により、Project MUSE上のアーカイブと新規出版物双方の可視性が高まるとしています。そのことは利用の増加をもたらし、ひいては本質的な人文学・社会科学分野の学術を広く普及させるというProject MUSEの使命を果たすことにつながる、と述べています。

米国議会図書館(LC)、同館のコレクションを活用したデジタル人文学研究を支援する“Computing Cultural Heritage in the Cloud”プロジェクトの開始を発表

2021年6月17日、米国議会図書館(LC)が、“Computing Cultural Heritage in the Cloud”プロジェクトの開始を発表しています。

同プロジェクトは、LCのコレクションと最先端の技術を組み合わせた大規模なデジタル人文学研究を支援するものです。アンドリュー W.メロン財団からの100万ドルの助成を受けて、デジタル人文学・コンピュータ科学の3人の研究者と同館の主題専門家・技術専門家が協力して以下の取組を行います。

・Lincoln Mullen氏(ジョージ・メイソン大学美学美術史学部准教授)
同館のコレクション全体から聖書の引用箇所を検出する“America’s Public Bible: Machine-Learning Detection of Biblical Quotations Across LOC Collections via Cloud Computing”

E2394 - 学術文献検索サービスSemantic Scholarと自動要約機能

Semantic Scholarは米国のアレン人工知能研究所(Allen Institute for AI:AI2)が開発する学術文献検索サービスである。様々な学術文献検索サービスがある中,Semantic Scholarの特長は,人工知能(AI)技術,特に機械学習によって論文から意味やつながりを抽出することで,各利用者の研究に最も関連がある論文の発見ならびに理解を支援することである。本稿では,Semantic Scholarの概要ならびに2020年11月にベータ版として公開された論文を一文に要約するTLDR機能について報告する。

米・アレン人工知能研究所(AI2)、Semantic Readerのベータ版を公開

米国のアレン人工知能研究所(Allen Institute for AI:AI2)による学術文献検索サービス“Semantic Scholar”のTwitterアカウントでの2021年5月12日付け投稿において、“Semantic Scholar”に関連するサービスとして、”Semantic Reader”のベータ版公開が発表されています。

科学論文を読むときの課題として、用語や数学記号の定義、引用論文の詳細を探すために、頻繁にページを行き来しなければならないということが挙げられます。Semantic Readerは、関連のない情報を暗く表示させ、論文中で定義や引用論文の詳細を提供することによって、この課題の解決を図ります。

Semantic Readerは、AI2のSemantic Scholarのチーム、米国のカリフォルニア大学バークレー校、米国のワシントン大学による、科学論文を読むためのインターフェース“ScholarPhi”のプロジェクトから開発されたものです。ScholarPhiはアルフレッド・P・スローン財団より一部助成されています。ScholarPhiのユーザビリティ調査では、ScholarPhiを使用すると、PDFリーダーよりも、論文の深い理解が必要な質問への回答までの時間が短くなることが判明しました。

ページ