E2271 – J-STAGE Data:オープンサイエンス時代の新たなサービス

カレントアウェアネス-E

No.393 2020.06.25

 

 E2271

J-STAGE Data:オープンサイエンス時代の新たなサービス

科学技術振興機構・重松麦穂(しげまつむぎほ)

 

   近年,情報技術の急速な発展を受け,あらゆる人々が研究成果へ自由にアクセスでき,それらを利活用できる環境が現実のものとなっている。このような環境を利用して実現される新しいサイエンスのあり方は「オープンサイエンス」と呼ばれている。その名を冠した様々な取組が世界規模で行われているが,中でも研究データの公開・共有はここ数年関心が高まっているトピックの一つである。人工知能(AI)の台頭に代表されるように,データを利活用することで新たな価値を創出する取組は産・学を問わず期待されている。また,研究不正の防止という観点から,多くの大学や研究機関,研究資金助成機関等がデータ管理・公開に係る方針を掲げ研究の透明性の担保に努めている。さらに,ジャーナルにおいてもデータの公開や共有に関するポリシーの整備が行われ,研究者が研究成果論文を発表する際,その根拠となるデータの公開を求められる場面は多くなっている。こうした状況に対応すべく,国立研究開発法人科学技術振興機構(JST)は,日本におけるオープンサイエンスの推進に資することを目的にJ-STAGE Dataを構築した。

   J-STAGE Dataは,JSTが運営する電子ジャーナルプラットフォームである科学技術情報発信・流通総合システム(J-STAGE)の登載記事に関連するデータを公開するデータリポジトリである。 2020年3月16日に試行運用を開始し,現在はパイロットジャーナルとしてデジタルアーカイブ学会の発行する『デジタルアーカイブ学会誌』の協力を得て,同誌の掲載記事に関連するデータを公開している。

   J-STAGE Dataは,英国のDigital Science社が提供するデータリポジトリfigshareのクラウドサービスをプラットフォームとして利用している。figshareは世界的に認知されたデータリポジトリサービスであり,いくつかの海外大手出版社等も同サービスを利用して自誌専用のデータリポジトリを設置している。

   J-STAGE Dataにおけるデータの検索,閲覧,ダウンロードはすべて無料で行うことができ,ユーザー登録等の手続きも必要無い。J-STAGE Dataで公開するデータは基本的に二次利用が可能なコンテンツとして流通する。二次利用を認める範囲は,データ登載時にクリエイティブ・コモンズ・ライセンス等のライセンスから一つを選択できる。また,データの公開後にはJaLC DOIが付与され,永続的なアクセスが保障される。公開されているデータには,それぞれの閲覧回数およびダウンロード回数が表示される他,SNSやニュースサイト等でデータに言及があった場合には自動的にオルトメトリクスを集計・表示し,データがどの程度利用されているかを容易に把握することができる。

   また,J-STAGE Dataは多様な形式のデータファイルの公開に対応している。研究データとして取り扱われる内容は,画像や動画をはじめ,計測値を記録したスプレッドシート,解析に用いた独自のプログラム等,分野により様々であるが,J-STAGE Dataではそれらをファイルの形式によらず一律に検索,閲覧,ダウンロードすることができる。コンテンツの種類を識別するメタデータ情報(アイテムタイプ)において「Dataset(実験や調査で得られるような変数と値の組のまとまり)」という属性を持つデータは,Google Dataset SearchやDigital Science社の研究ディスカバリープラットフォームDimensionsからも検索することができるようになる。また,Dimensionsの収録するコンテンツがJ-STAGE Data上のデータを引用している場合は,その被引用数が当該データの詳細画面に表示される。

   J-STAGE Dataの構築に合わせ,J-STAGEにおいても記事関連データの流通を促進するための機能をリリースしている。J-STAGE登載記事の書誌画面には,記事関連データの情報(データのタイトル,作成者,DOI等)を表示させることができ,リンクを通じて関連データへの素早いアクセスが可能となっている。この表示はJ-STAGE Data以外のリポジトリ上に関連データが公開されている場合も利用可能であるが,J-STAGE Dataで公開されているデータに関しては上記の情報に加えてデータのプレビューも表示されるようになっており(プレビュー表示が可能なファイル形式のみ),データの概観をその場で見ることができる。

   J-STAGE Dataを利用したデータの登載・公開はJ-STAGE登載誌のオプションサービスであり,データの公開や管理に関するポリシー等はそれぞれの発行機関によって定められる必要がある。今後の本格運用においては,利用希望誌からの申請を通じてサービスを提供することを予定している。リポジトリのストレージは資料毎に割り当てられ,それぞれの資料についてアイコンやヘッダーをカスタマイズできるトップページ等が設けられる。

   J-STAGE Dataの開発は,論文と研究データを紐付けることを目的として,内閣府の「統合イノベーション戦略2019」の「研究データ基盤の整備・国際展開」の施策の一つにも位置付けられている。冒頭に述べたように,オープンサイエンスの時代における研究成果発信に重要な役割を担うものとして研究データは多方面から注目されており,J-STAGE Dataは,そうした新たな時代の期待に応えるサービスとなることを目指し,本格運用に向け準備を進めていく。また,2020年度のJ-STAGEセミナーにおいても研究データを年間テーマに据え,データを取り巻く現状や今後の方策について利用機関への情報提供を行う予定である。

Ref:
情報基盤事業部. J-STAGE Data リリースノート. 科学技術振興機構. 2020-03.
https://www.jstage.jst.go.jp/static/files/ja/pub_release_jstage-data.pdf
村上絵美ほか. J-STAGEの新たな取り組み. 情報の科学と技術. 2019, 69(11), p. 497-503.
https://doi.org/10.18919/jkg.69.11_497
J-STAGE Data.
https://jstagedata.jst.go.jp/
“J-STAGE Dataの概要”. J-STAGE Data.
https://www.jstage.jst.go.jp/static/pages/JstageData/about/-char/ja
J-STAGE Data マニュアル よくあるご質問. J-STAGE Data.
https://876az-branding-figshare.s3-eu-west-1.amazonaws.com/jstage/J-STAGE_Data_FAQ_J.pdf
“Figtionary”. Figshare.
https://knowledge.figshare.com/articles/item/figtionary
“Dimensions releases datasets as a new content source for all users”. Dimensions. 2020-01-28.
https://www.dimensions.ai/news/dimensions-releases-datasets-as-a-new-content-source-for-all-users/
統合イノベーション戦略2019. 内閣府. 2019-06-21.
https://www8.cao.go.jp/cstp/togo2019_honbun.pdf