人工知能

人文学オープンデータ共同利用センター(CODH)、日本古典籍くずし字データセットに字形データを大幅に追加:データセットを活用した無料のAIくずし字OCRサービスも公開

2019年11月11日、人文学オープンデータ共同利用センター(CODH)は、日本古典籍くずし字データセットに字形データを大幅に追加し、文字数が684,165字から1,086,326字となったことを発表しました。

データセットに対してクリーニングを行い、一部の新字を旧字に統合した結果、文字種については4,645種から4,328種に減少したとあります。

あわせて、同データセットを活用したAIくずし字OCRサービスである「KuroNetくずし字認識サービス」も公開されました。IIIFに準拠した画像を対象として、多文字くずし字OCR機能を提供するものです。

「KuroNetくずし字認識サービス」のページでは、利用には登録が必要であること、利用は無料であるが他者の利用をさまたげるような利用状況となった場合は制限を行う可能性があること等、利用方法と制限に関する説明が掲載されています。

京セラコミュニケーションシステム株式会社、公共図書館システム「ELCIELO」と画像解析AIを組み合わせた蔵書点検用システムの開発を開始

2019年11月6日、京セラコミュニケーションシステム株式会社は、同社の公共図書館システム「ELCIELO」について、グループ会社の株式会社Rist提供の画像解析AIによる蔵書点検システムの開発を開始したことを発表しました。

同社のプレスリリースによると、開発が進められている蔵書点検システムは、スマホやタブレットなどで図書館の書架一面を撮影した写真を使用して、1点ずつ点検することなくまとめて蔵書点検できるようになるシステムです。撮影された画像データをRistが提供する画像解析AIに取り込み、画像内の複数冊の書誌の背表紙からタイトル・著者名・分類番号をAIが分析、書誌登録データベースとマッチング・照合して蔵書点検が行われます。

同社は、タブレットなどで撮影を行うことを想定し2020年2月の提供開始を目指しています。また、ドローン等による無人状態での書架撮影自動化構想があることや、撮影したデータを活用し自宅などから図書館を体験できるバーチャル図書館の開発の検討を行っていることも併せて発表しています。

人文学オープンデータ共同利用センター(CODH)、IIIF Curation Viewerに新機能「アノテーションビューモード」を追加:新機能を体験できるサービス「江戸マップβ版」「くずし字データセット閲覧ビューア」も公開

2019年11月5日、人文学オープンデータ共同利用センター(CODH)は、IIIF準拠の画像ビューワであるIIIF Curation ViewerのV1.7を公開したことを発表しました。

主要な新機能として次の2点が紹介されています。

・新機能「アノテーションビューモード」の追加により、IIIF画像上に場所や文字のマーカーが表示可能となり、IIIF環境でも地図や翻刻が利用しやすくなったこと
・IIIFマニフェストに含まれるIIIF Image APIに非対応のリソース(例:JPEG画像)等の表示にも対応したこと

また、新機能を体験できるサービスとして、古地図の上に画像マーカーを表示することでIIIFビューアを地図アプリのように使える「江戸マップβ版」と、くずし字の翻字を文字マーカーとして表示することでくずし字と現代の文字を左右に並べて表示する「くずし字データセット閲覧ビューア」を新たに公開したことも発表されています。

英国の大手独立系シンクタンクDemos、人工知能(AI)・ロボット工学等の新技術が研究部門の将来へ与える潜在的な影響に関する調査の中間報告書を公表

2019年10月1日、英国の大手独立系シンクタンクDemosは、人工知能(AI)・ロボット工学等の新技術が研究部門の将来へ与える潜在的な影響に関する調査の中間報告書として、“Research 4.0: Research in the age of automation”を公表したことを発表しました。

この調査は英・Jiscの支援の下で実施されているものです。自然言語プログラミングから画像認識まで、現代の研究に適用されるAI関連技術に特に焦点を当てながら、研究部門における第4次産業革命技術の展開と影響、そして「自動化された研究(automated research)」の現状が調査されています。

E2179 - AI技術を取り入れた「くずし字翻刻学習・指導システム」

立命館大学アート・リサーチセンター(以下「立命館ARC」)では,様々なデジタルアーカイブを構築しており,その中の浮世絵と古典籍のポータルデータベースに凸版印刷株式会社の開発による人工知能(AI)技術を組み込んだ「くずし字翻刻学習・指導システム」が2019年1月に導入された。学習・研究用のプロジェクトベースによる活用が可能となっており,古典籍の翻刻本文アーカイブの進展も期待できる。

台湾・科技部、人工知能(AI)の研究開発ガイドラインを公表

2019年9月23日、台湾・科技部は、台湾で人工知能(AI)の研究開発に携わる研究者に向けたAI研究開発ガイドライン「人工智慧科研發展指引」(AI Technology R&D Guidelines)を公表しました。

人間中心の価値観(Human-centred Values)、持続的な発展(Sustainable Development)、多様性と包摂性(Diversity and Inclusion)の3点を中核的価値に据えた上で、次の8項目についてガイドラインを示しています。

・公益と福祉(Common Good and Well-being)
・公平性と公正性(Fairness and Non-discrimination)
・自治権とコントロール(Autonomy and Control)
・安全性(Safety)
・プライバシーとデータガバナンス(Privacy and Data Governance)
・透明性と追跡可能性(Transparency and Traceability)
・解釈可能性(Explainability)
・説明責任とコミュニケーション(Accountability and Communication)

英・ケンブリッジ大学出版局、UNSILO社と提携:AI技術を用いた関連コンテンツの特定とリンク提供のため

2019年9月16日、出版社に対しAI技術によるソリューションの提供を行っているデンマークのUNSILO社は、英・ケンブリッジ大学出版局と提携を結んだことを発表しました。同社は、ケンブリッジ大学出版局の100万を超える雑誌論文と書籍の各章のなかから、AI技術を利用して関連のあるコンテンツを特定し、リンク付けを行います。

同社は、機械学習とAIツールを用いてテキストコーパス中の重要な概念の特定を行いますが、これらの概念は、主題コレクションの構築、関連記事の特定、関連するジャーナルの検索等、出版ワークフローに対する幅広いソリューションの基礎を形成するものとあります。新規公開された論文、書籍は公開後数時間以内にインデクシングが行われ、Cambridge Coreの他のコンテンツにリンクされるとしています。

米国議会図書館(LC)や英国芸術・人文科学研究会議(AHRC)等の米・英の機関が文化機関におけるデジタルスカラシップの役割をテーマに連携

2019年9月18日、米国の人文科学基金(NEH)・国立科学財団(NSF)・スミソニアン協会・議会図書館(LC)及び英国の芸術人文科学研究会議(AHRC)、工学物理科学研究会議(EPSRC)が、図書館・博物館等の文化機関の未来を再考するため連携すると発表されています。

文化機関におけるデジタルスカラシップの役割をテーマに連携するもので、組織のリーダーシップの方向性や新たな学芸的実践の開発、新たな最先端な研究や課題の開拓、21世紀型のコレクションを基盤とした研究方法の推進といった、利用者が文化遺産を体験する方法を変革することが目指されています。

連携事業の第1弾として、9月18日と19日、米・ワシントンDCでワークショップが開催されます。

ワークショップは、両国の学術機関・文化機関の専門家(データ科学者・考古学者・デジタルキュレーター・鳥類学者)により、デジタル技術が博物館等に影響を与えている(今後与えるであろう)ことを調査するもので、機械学習・人工知能(AI)・クラウドソーシング等の共同作業モデル、来館者の体験向上などをテーマとしています。

今後の連携活動の基盤となるよう、優先されるテーマや推奨される活動など、当日の議論をまとめた報告書が出される予定です。

Enago、AIを用いた原稿評価・編集サービス”AuthorONE”を立ち上げ

論文校正・校閲サービス等を手掛けるEnagoが、AIを用いて投稿原稿を評価し、編集も自動で行う出版者向けサービス”AuthoreONE”の提供を開始すると発表しました。

同サービスはAPIを用いて編集システムに組み込む等、出版者自身のWebページや現在使用しているシステムに組み込むことが可能とのことです。原稿評価サービスについては当面、無料で提供するとされています。

Enago Launches AuthorONE - An AI-powered Manuscript Assessment And Automated Copy-editing Solution For Publishers(Enago、2019/9/11付け)
https://www.enago.com/news/enago-launches-authorone

【イベント】日本文化とAIシンポジウム2019 ~AIがくずし字を読む時代がやってきた~(11/11・東京)

2019年11月11日、東京都千代田区の一橋講堂において、「日本文化とAIシンポジウム2019 ~AIがくずし字を読む時代がやってきた~」が開催されます。

人文学オープンデータ共同利用センター(CODH)、国立情報学研究所(NII)、国文学研究資料館の共催によるものです。

人工知能(AI)を活用してくずし字を読み解く研究の、過去・現在から未来までを議論し、世界に広がるくずし字研究の最前線を紹介するシンポジウムです。

参加費は無料で、参加には事前の申し込みが必要です。

内容は以下の通りです。

〇開会挨拶
 北本 朝展氏(ROIS-DS人文学オープンデータ共同利用センター/国立情報学研究所)

〇セッション1-日本の文字文化とAI
・木簡情報のオープンデータ化と文字画像DB連携の強化
 馬場 基氏(奈良文化財研究所)

・東京大学史料編纂所における字形データの蓄積経緯と花押データへの展開
 井上 聡氏(東京大学史料編纂所)

・新たな検索機能提供のための調査研究活動―次世代デジタルライブラリーを中心とした近年の取組紹介―
 青池 亨氏(国立国会図書館電子情報部電子情報企画課次世代システム開発研究室)

ページ