E2367 – 新しい学術情報検索基盤「CiNii Research」プレ版について

カレントアウェアネス-E

No.410 2021.03.25

 

 E2367

新しい学術情報検索基盤「CiNii Research」プレ版について

国立情報学研究所オープンサイエンス基盤研究センター・大波純一(おおなみじゅんいち)

 

   2020年11月6日に,国立情報学研究所(NII)のオープンサイエンス基盤研究センター(RCOS;E1925参照)は,新サービスである「CiNii Researchプレ版」(以下「プレ版」)を公開した。本サービスは2021年4月公開予定の「CiNii Research」(以下「本公開版」)の先行バージョンとして,試験的にリリースされたものである。本稿では「CiNii Research」の開発の経緯と今後について紹介する。

●CiNiiについて

   NIIの学術情報検索基盤として広く知られるCiNiiは,時代と共に役割や機能を変えて発展を続けてきた(E638E1697E1894CA1691参照)。しかし近年,学術情報公開における環境は大きく様変わりしつつある。研究成果のアウトプットとして研究データ公開の動きが広まりつつあり,さらにプレプリントやSNS,動画での研究情報の発信といった成果公開の多様化の動きもある。このためNIIにおいても2017年頃から既存の学術情報検索基盤の枠組みが見直されることとなった。

●新たなCiNii=CiNii Research

   このような状況の中で,新サービスの骨子として,

  • CiNiiが異なるデータベースで提供している論文や書誌,博士論文の情報を一括して検索できること
  • 新たに研究データや研究プロジェクト情報を検索対象とすること

が考案された。研究データについては機関リポジトリのデータベースを含み,NIIが提供する学術情報基盤「Research Data Cloud」(RDC)の,研究データライフサイクルの中の一端を担う位置付けとした。

   その上で内部データについては,

  • 論文や研究助成等の各情報の単体を等価の「エンティティ」と見なして,ノード間の引用等の関係性を線(エッジ)でつなぎ,グラフデータベースとして構築すること
  • 付与されているIDや内容から,相同と見なされるエンティティがあれば,内部で定められた基準で一つに統合する「名寄せ」を実施すること
  • 外部で公開されている分野別データベースや海外の学術情報基盤ともAPI等で情報を相互にやり取りできるよう,標準化されたスキーマにメタデータを格納すること
  • スキーマは主にオープンアクセスリポジトリ推進協会(JPCOAR;E1830参照)が策定しているものをベースとすること

が考案された。これは特に日本国内の研究活動の全てを一つの「CiNiiナレッジグラフ」としてまとめ,セマンティックな情報として公開していくための先進的な試みである。しかし,様々な情報源から収集されるメタデータの形式は多様であるため,このような機能を実現するにはデータ形式を統一するための膨大な手間が必要であった。

   そして,研究(Research)の事柄を包括的に検索できるようにするため,新たなCiNiiとして「CiNii Research」の開発を開始し,2020年に全体の概観が完成した。そのため冒頭の通り,まずは2020年11月に先行公開バージョンの「CiNii Research プレ版」を公開し,サービスの稼働状況と利用者からのフィードバックを受ける体制として試験運用を開始した。メタデータの形式を合理的にフィッティングする施策も2021年度の実施を予定している。

●CiNii Research プレ版の特徴

   プレ版では開発途上の部分が存在し,一部機能は利用できない。一方,全体のインターフェースや内部データの構成は大まかには完成しているため,本公開版とほぼ同等の検索が体験できる作りとなっている。基本的には一般的な検索サービス同様,検索ボックスにキーワードを入力することで,ヒットする情報を閲覧することができる。上部のタブは,「すべて」「研究データ」「論文」「本」「博士論文」「プロジェクト」で区切られており,ここから他のCiNiiの区分での情報収集も可能となっている。検索結果のページには絞り込みのためのファセットを配したカラムを設置し,情報のフィルタリングをしやすくした。ファセットの項目やメタデータの項目を絞った詳細検索については本公開版でさらに強化される予定である。検索結果からアクセスできる各エンティティのページには,エンティティ自身の情報が上部に表示され,下側には「関連論文」や「関連データ」,「関連プロジェクト」が表示される。

●CiNii Researchのこれから

   CiNii Researchは2021年4月に本番公開を行い,詳細検索を通じてリッチな研究情報に到達できるよう,鋭意開発中である。本番公開後も対象分野拡大のためのデータの追加や,よりセマンティックな検索ができるための機能追加など,発展的な進化を続けていく。学術情報に携わる方々には是非ご注目いただきたい。

Ref:
“研究データを含めた幅広い研究リソースの統合検索を実現~「CiNii Research プレ版」を先行公開~”. 国立情報学研究所. 2020-11-06.
https://www.nii.ac.jp/news/release/2020/1106.html
CiNii Research プレ版.
https://cir.nii.ac.jp/
国立情報学研究所オープンサイエンス基盤研究センター. 研究データ検索基盤CiNii Research. JUCE Journal. 2019, 2019年度(3). p. 9-10.
http://www.juce.jp/LINK/journal/2002/pdf/03_01.pdf
Kato, Fumihiro. ; Ohmukai, Ikki. ; Kanazawa, Teruhito. ; Kurakawa, Kei. CiNii Research: A prototype of Japanese Research Data Discovery. eResearch Australasia 2018. 2018.
https://conference.eresearch.edu.au/2018/08/cinii-research-a-prototype-of-japanese-research-data-discovery/
大向一輝. 特集, データベース構築の今:CiNii Articlesのシステムデザインとデータモデル. 情報の科学と技術. 2012, 62(11). p. 473-477.
https://doi.org/10.18919/jkg.62.11_473
山地一禎. オープンサイエンス基盤研究センターの新設について. カレントアウェアネス-E. 2017, (327), E1925.
https://current.ndl.go.jp/e1925
CiNii収録の学術論文データ,Google Scholarから検索可能に. カレントアウェアネス-E. 2007, (105), E638.
https://current.ndl.go.jp/e638
上村順一,古橋英枝. NII,“CiNii Dissertations”を試験公開. カレントアウェアネス-E. 2015, (286), E1697.
https://current.ndl.go.jp/e1697
古橋英枝. CiNii Booksの本文アクセス強化. カレントアウェアネス-E. 2017, (321), E1894.
https://current.ndl.go.jp/e1894
江川和子. オープンアクセスリポジトリ推進協会の発足. カレントアウェアネス-E. 2016, (309), E1830.
https://current.ndl.go.jp/e1830
大向一輝. 学術情報プラットフォームとしてのCiNii. カレントアウェアネス. 2009, (301), CA1691, p. 2-4.
https://doi.org/10.11501/1166494