NII(国立情報学研究所)

くずし字認識に関する全世界的なコンペティションが機械学習コンペプラットフォームKaggleで開催

2019年7月10日、世界最大規模の機械学習コンペプラットフォームKaggleで、くずし字認識に関する全世界的なコンペティション「くずし字認識:千年に及ぶ日本の文字文化への扉を開く」の開催が発表されました。

このコンペティションは、情報・システム研究機構のデータサイエンス共同利用基盤施設に所属する人文学オープンデータ共同利用センター(CODH)、同機構の国立情報学研究所(NII)・人間文化研究機構の国文学研究資料館(国文研)の主催により、2019年7月中旬から10月中旬まで開催されます。

開催の目的として、深層学習(機械学習)の活用を中心とした近年のAIの飛躍的な発展を取り入れることで、新方式のくずし字OCRの研究開発が進む可能性が高まっていることを背景に、くずし字OCRの性能向上に向けたアイデアをオープンに募集することが挙げられています。

コンペティションでは、国文研とCODHが共同整備し公開中の「くずし字データセット」改良版が提供され、コンペ参加者は与えられた画像内に書かれた全てのくずし字を認識して出力する「くずし字OCRアルゴリズム」を期間内に開発するという流れで進められます。上位入賞したアルゴリズムについてはコンペ後自由に使えるよう公開される予定です。

ジャパンサーチ(試験版)、立命館大学アート・リサーチセンター(ARC)の古典籍ポータルデータベースと連携し古典籍資料約16万点が検索可能になる

ジャパンサーチ(試験版)は、2019年7月9日付のTwitterにおいて、立命館大学アート・リサーチセンター(ARC)の「ARC古典籍ポータルデータベース」と連携したことを発表しました。

この連携により、ジャパンサーチ(試験版)では、海外機関の所蔵資料も含め約16万点のウェブ上で公開された古典籍資料が検索可能になっています。

@jpsearch_go(Twitter,2019/7/9)
https://twitter.com/jpsearch_go/status/1148529708167917569

お知らせ(ジャパンサーチ(試験版))
https://jpsearch.go.jp/news
※2019年7月9日付けのお知らせに「「ARC古典籍ポータルデータベース」と連携しました」とあります。

国立情報学研究所「学術情報基盤オープンフォーラム2019」のセッション 「CAT2020:目録所在情報システムのこれから」の当日資料と動画が公開される

2019年7月10日、国立情報学研究所目録所在情報サービスのウェブサイト上で、2019年5月30日に開催されたセッション「CAT2020:目録所在情報システムのこれから」の当日資料と動画の公開が発表されています。同セッションは国立情報学研究所「学術情報基盤オープンフォーラム2019」において開催されたものです。

NII学術情報基盤オープンフォーラム2019 「CAT2020:目録所在情報システムのこれから」の動画の公開(国立情報学研究所目録所在情報サービス, 2019/7/10)
https://www.nii.ac.jp/CAT-ILL/2019/07/nii2019_cat2020.html

CAT2020:目録所在情報システムのこれから(国立情報学研究所)
https://www.nii.ac.jp/openforum/2019/day2_5.html

国立情報学研究所(NII)、公開中の「楽天データセット」へRakuten Franceに掲載された書籍情報等に関する新規データを追加

2019年7月5日、国立情報学研究所(NII)は、情報学研究データリポジトリ(IDR)で公開中の「楽天データセット」に新規データを追加したことを発表しました。

「アノテーション付きデータ」に、Rakuten Franceに掲載された書籍情報とその一部に対して正規化し著者名表記を付加したデータが、今回の更新で追加されています。

楽天データセットは、楽天株式会社とNIIが協力して研究者に提供しているデータセットとして2010年から公開されており、データ更新は今回が8度目となります。

公開中の「楽天データセット」に新規データを追加(NII,2019/7/5)
https://www.nii.ac.jp/news/2019/0705.html

楽天データセット(IDR)
https://www.nii.ac.jp/dsc/idr/rakuten/rakuten.html

国立情報学研究所(NII)、「オリコンデータセット」の提供開始を発表

2019年6月24日、国立情報学研究所(NII)は、株式会社oricon ME(オリコン)と学術研究分野向けのデータ提供で提携し、同社が保有する「オリコン顧客満足度(R)」の調査データを「オリコンデータセット」として2019年7月1日から順次提供開始することを発表しました。

オリコン顧客満足度(R)調査は、実際に提供されているサービス等を利用したことのあるユーザーを対象にアンケート形式でデータを収集するものであり、2006年の実施開始以降、これまでに約 100 の産業をカバーし累計 200 万人以上の回答を蓄積しているとあります。

NIIの「オリコンデータセット」のページによれば、当初提供を行うのは「保険」「住宅」など11ジャンル、88業種について、2016年以降に実施された200件です。また、提供は大学および公的研究機関の研究者を対象としており、利用目的は情報学に関連する学術研究に限るとしています。

国立映画アーカイブ、国立情報学研究所(NII)と共同でウェブサイト「映像でみる明治の日本」を開設:日本映画生誕120年記念

2019年6月27日、国立映画アーカイブが、国立情報学研究所(NII)と共同でウェブサイト「映像でみる明治の日本」を開設したと発表しています。

日本映画生誕120年を記念したもので、現存する最古の日本映画『紅葉狩』(重要文化財)を始めとする明治期に撮影された日本映画5作品の動画配信や、失われた「最古の日本映画」のフィルムのコマ(35mmフィルムの一部)の高精細画像を見ることができます。

WEBサイト「映像でみる明治の日本」開設のお知らせ (国立映画アーカイブ,2019/6/27)
https://www.nfaj.go.jp/ge/topics/20190627/

映像でみる明治の日本(国立映画アーカイブ)
https://www.nfaj.go.jp/onlineservice/mpf/

映像でみる明治の日本
https://meiji.filmarchives.jp/

国立国会図書館サーチ、「CiNii Books」とのハーベスト連携を開始

2019年6月24日、国立国会図書館サーチは、CiNii Booksとの連携を横断検索からハーベストによる連携に切り替えたことを発表しました。

今回の連携方法の切り替えに伴う主な変更点として、Cinii Booksのメタデータに関し、一度に検索できる件数が増加したこと、国立国会図書館サーチのAPIによる提供を開始したことを挙げています。

なお、国立国会図書館サーチで提供する「CiNii Books」のメタデータは、「クリエイティブ・コモンズ 表示 4.0 国際 パブリック・ライセンス」(「CC BY」)の条件により、オープンデータとして利用可能です。

「CiNii Books」とのハーベスト連携を開始しました(国立国会図書館サーチ, 2019/6/24)
https://iss.ndl.go.jp/information/2019/06/24_cinii/

【イベント】説明会「ジャパンサーチ発進!~連携拡大に向けて」(7/17・東京、京都)

2019年7月17日、国立国会図書館(NDL)の東京本館及び関西館において、説明会「ジャパンサーチ発進!~連携拡大に向けて」が開催されます。なお、関西館会場はテレビ会議システムによる中継となります。

本説明会は、NDLと内閣府知的財産戦略推進事務局が共催するものであり、ジャパンサーチ試験版の機能、連携方法等の説明に加え、連携・利活用事例の報告や、参加者からの質問も交えたパネルディスカッションが行われます。

参加費は無料です。定員は東京本館300名、関西館60名(いずれも先着順)であり、申込みフォームからの事前の申込みが必要です。

主なプログラムは次のとおりです。

第Ⅰ部:「ジャパンサーチ(試験版)」について
〇ジャパンサーチ(試験版)の機能と連携方法について
国立国会図書館電子情報部副部長 木藤淳子

〇ジャパンサーチ(試験版)との連携事例報告
国立公文書館総務課総括係長/総務課情報システム係長 平野宗明氏
東京国立博物館学芸企画部博物館情報課情報管理室長 村田良二氏
国立新美術館主任研究員 室屋泰三氏
人間文化研究機構総合情報発信センター特任准教授 大内英範氏
立命館大学衣笠総合研究機構准教授 金子貴昭氏

ジャパンサーチ(試験版)、新機能「ウェブパーツ機能」をリリース

2019年5月31日、ジャパンサーチ(試験版)のページで、新機能「ウェブパーツ機能」のリリースが発表されています。

ジャパンサーチ内で使われている画面の構成要素を、部品としてジャパンサーチ以外のウェブサイトでも利用できる機能です。2019年6月6日時点では、マイノート及びギャラリー(連携機関のみ)からウェブパーツの出力が行えるとあります。

また、スタイルシートがページ全体に適用されるため、既存のスタイルシートと競合を起こす可能性があることなど、利用に際しての注意点4点が示されています。

お知らせ(ジャパンサーチ(試験版))
https://jpsearch.go.jp/news
※2019年5月31日付けのお知らせに「新機能「ウェブパーツ機能」をリリース」とあります。

ウェブパーツ(ジャパンサーチ(試験版))
https://jpsearch.go.jp/api/webparts
※ウェブパーツ機能に関する開発者向け情報ページです。

神戸大学附属図書館、CiNii Booksから「震災文庫」のデジタル化資料が利用できるようになったと発表

2019年6月4日、神戸大学附属図書館は、CiNii Booksから「震災文庫」のデジタル化資料456件が利用できるようになったと発表しています。

【震災文庫】デジタル化資料をCiNii Booksから利用できるようになりました(神戸大学附属図書館,2019/6/4)
https://lib.kobe-u.ac.jp/libraries/13361/

参考:
国立情報学研究所(NII)、CiNii BooksとERDB-JPの図書データとの連携開始を発表
Posted 2019年5月16日
http://current.ndl.go.jp/node/38170

ページ