カレントアウェアネス
No.344 2020年6月20日
CA1976
組織IDの動向−RORを中心に
科学技術振興機構:中島律子(なかじまりつこ)
1. はじめに
学術情報流通において、情報を同定する役割を持つ永続的識別子(Persistent Identifier:PID)は今や必要不可欠であり、利用者にとってもなじみ深いものになっている。その代表は、論文等出版物に登録されるデジタルオブジェクト識別子(Digital Object Identifier:DOI)(1)であり、さらにDOIは、研究データ等論文以外の研究成果物にも用いられるようになっている。また、研究者個人を識別するPIDとして、世界的には ORCID(CA1740、CA1880参照)(2)が普及している。そして、学術情報を有機的に連携させるための「ミッシングピース」として必要性が訴えられているのが組織に対して付与されるPIDであり、その中でも、Research Organization Registry(ROR)(3)が注目を集めている。RORは、オープンで持続可能な組織PIDとして、2019年1月にMVR(Minimum Viable Registry)の提供を開始した。2020年4月現在、約9万8,000件のユニークなROR IDとこれに対応するメタデータが登録され、その活用が進んでいる。
2. ROR
RORの立ち上げに当たっては、2016年から2018年までの間に、ORCID、DataCite(CA1849参照)、Crossref(CA1836参照)等の主要なPID登録機関を中心に、オープンかつコミュニティ主導であることを意識した取り組みによる議論が行われた。2017年1月にはORCID内に組織識別子ワーキンググループ(OrgID WG)が立ち上がり、レジストリの実装計画が検討された(4)。WGは、オープンで永続的な組織IDレジストリを構築するには、コミュニティのガバナンスと、コミュニティによるデータ品質への深い関与が必要であり、要件として、運営者によってキュレーションされたデータ、権限を有する者用のデータ更新管理機能、登録する組織のレベルがユースケースに対して適切であること、人および機械にとって可読であること等を挙げた(5)。運営体制については、ホスト機関による非営利モデルを採用し、少なくとも初期の立ち上げ期間には、組織IDを登録するための新機関を設立することはしないと結論した(6)。組織IDレジストリを実現するためのビジネスモデルはホスト機関とデータソースに大きく依存するとし、2017年秋に、これに関心を持つホスト機関、データソース/プロバイダー、および一般的な研究コミュニティに対して意見招請(Request For Information:RFI)を発出した(7)。これを踏まえた議論の結果、カリフォルニア電子図書館(California Digital Library:CDL)、Crossref、DataCite、およびDigital Science社が、スタートアップ期間の管理者として、2018年にRORを開始した(8)。RORの歴史については、関連資料のリンクと共に、同レジストリのウェブサイトにまとめられている(9)。データは、Digital Science 社が運営する学術研究に関連する組織のデータベースGRID(10)をソースとし、クリエイティブ・コモンズ・ライセンスのCC0で提供している。運営は、上記4機関が中心となって、運営グループおよび3つのプロジェクトチーム(技術的実装、アウトリーチとコミュニケーション、製品開発と管理)により推進されており、2019年11月に拡大された運営グループには筆者も参加している。コミュニティベースの取り組みが強く意識され、コミュニティアドバイザー、RORを支援・採用することを誓約した署名者、資金提供者であるサポーターらにより支えられている(11)。
2019年1月にMVRの提供を開始した後、同年8月には主に研究データにDOIを登録する機関DataCite(12)のメタデータスキーマがRORに対応し、9月にはリポジトリDryad(13)が連携、さらに、グラント申請システムやジャーナル等との連携も行われ、活用が進んでいる(14)。Crossrefメタデータの対応も近いうちに予定されている(15)。
3. そのほかの組織ID
組織に対して付与されるIDは、他にもROR開始以前から存在する。RORの検討過程において、既存の組織IDに関する調査が2016年に行われた(16)。以下、この調査報告書で挙げられている組織IDを中心に、概要を紹介する。なお、記載した数値は全て2020年4月時点のものである。
Funder Registry(17)は、ファンディング機関が資金提供した研究から生産された出版物を追跡できるようにすることを目指し、当初FundRef(E1450参照)という名前で開発された。Elsevier社が内部用に作成したデータにCrossrefがDOIを割り当て、CC0の下でサービスを開始した。2万2,000機関以上の登録があるが、対象はファンディング機関のみである。Crossrefにより論文等出版物のDOIを登録する際、当該研究に資金を提供した機関をメタデータに記述することが可能であるが、そのIDとしてFunder Registryに登録されている機関のDOIを登録することができる。Funder RegistryのDOIは、約480万件の出版物データと結びついている。APIも提供されており、出版社等により利用されている投稿審査システムの中には、これを利用することにより、著者が投稿する際にこのレジストリの機関DOIを登録することが簡単にできる仕組みを備えているものがある(18)。
国際標準識別子(International Standard Name Identifier:ISNI;E1773参照)(19)は、ISNI国際機関(International Agency:ISNI-IA)が管理するレジストリで、研究者、発明者、作家等、創造的な作品の作成者(個人及び組織)を対象としており、ISO認証を受けている。1,100万件の登録のうち、組織は約93万件である。データは、OCLCがホストする国立および研究図書館からのデータの集約であるバーチャル国際典拠ファイル(VIAF)を始め、54のソースから提供されている。
Ringgold社(20)によって提供されているRinggold IDは、同社による学術および研究分野における主要な組織のデータベースIdentify databaseで検索できる。すべての国における学界、企業、病院、政府機関などのセクターの50万以上の組織を登録している。RinggoldはISNI登録機関でもあり、またORCIDの組織IDの提供者でもある。
Publisher Solutions International(PSI)(21)は、図書館、出版社、会員学会等が学術コンテンツを安全に利用できるよう、不正アクセス排除の目的でIPアドレスを検証するために、組織IDデータベースを構築した。
Digital Science社は、上述のデータベースGRIDを提供している。Digital Science社の他のサービスに利用するために運用されているが、CC0で公開されており、約9万8,000件の登録がある。なお現在、RORはGRIDデータを同期しており、またそのほか、Crossref Funder Registry、ISNI(Ringgoldのサブセットを含む)、WikidataのIDと相互運用性がある。
以上のように組織IDがすでに様々に存在し、相応の役割を果たしているにもかかわらずRORが検討された理由は、大学・研究機関や図書館等において研究成果を捕捉するために、研究成果とその著者の所属機関をつなげるリンクとして働くIDが必要とされたことである。またさらに、オープンな学術情報インフラとして提供され、活用されることが求められていた。報告書において、上記に挙げた既存IDのサービスは、「オープンに利用可能か」「メタデータ記述が標準的であるか」「持続的に運営可能か」「運用プロセスが透明であるか」「研究成果のリンクに必要な機能を備えているか」等の観点から検証され、全てを満たすものは存在しないと結論された。
一方日本では、文部科学省科学技術・学術政策研究所(NISTEP)が、大学・公的機関名辞書を整備している(22)。NISTEPは、政府予算で実施されている研究開発の実態やパフォーマンスの把握・分析・評価を行う際に必要な基礎データの整備を行っており、上記辞書はその中核的役割を担っている。2011年から整備を開始し、1年に1回の頻度で更新されている。大学及び公的研究機関を中心に、研究活動を行っている日本の約2万機関(約1万6,000の機関とその主な下部組織)の情報が掲載されている。
4. RORの今後の展望
RORは今後、レジストリを拡大し、データの操作・実装のための優れたツールの開発、ウェブサイトのユーザーフレンドリー化、ROR IDの幅広い採用と実装のサポート等を目指しており、システム構築を進め、GRIDと独立してデータキュレーションを行う構想を持っている(23)。2022年には付加価値の高いオプショナルの有料サービスを立ち上げ、オープンかつ無料のデータ提供を保ちつつコストを回収するモデルの確立を目指す(24)。このため、2019年10月にファンドレイジングを開始し、すでに10万ドルを調達した。得た資金により技術主任を雇用し、さらなる機能改善を行う計画である(25)。
今後、RORはDOIやORCIDのように、標準的に使われるPIDとなるだろうか。上で見てきたように、主要なリポジトリやジャーナル、データベースサービス等に導入されている状況を考慮すると、見通しは明るいように思われる。すでにデファクト化しているという意見を聞くこともある。実行機関であるCrossrefやDataCiteが自身のサービスを展開する上で困難を乗り越えてきた経験を生かし、またコミュニティ標準となっている自らの既存サービスでRORの利用を開始するという戦略展開から見ると、少なくとも、これらサービスが支配的に使われている国際的な商業出版社を中心とした学術情報プラットフォームにおいては導入が進むと考えられるだろう。データが充実するかどうか、持続的に運営できるかどうかは、資金提供者や有料サービス化した際の利用者がどれほど現れるかによるが、それには技術的な困難さ(対象物である「組織」は他のPIDに比べて統合・分割が頻繁に起きる、階層構造が複雑、表記揺れが多い、等)をどのように乗り越えられるか、また初期段階で多様なサービスにどれほど導入されるかが関わってくるだろう。
日本においては、論文に登録するDOIの普及は進んでいるが、研究データ等その他の研究成果へのDOI登録や、ORCIDの普及率は、他国と比べると高いとはいえない(26)。ORCIDの普及率には、日本では公的研究資金に応募する際に使われる政府の府省共通研究開発管理システム(e-Rad)で使用される研究者番号が既に普及していることが関係していると考えているが、組織IDの今後の展開についても、日本独自の既存IDとの関係が鍵となるかもしれない。
(1) Digital Object Identifier System.
https://www.doi.org/, (accessed 2020-04-16).
(2) ORCID.
https://orcid.org, (accessed 2020-04-16).
(3) ROR.
https://ror.org/, (accessed 2020-04-16).
(4) “Organization Identifier Working Group”. ORCID.
https://orcid.org/content/organization-identifier-working-group, (accessed 2020-04-16).
(5) Pentz, Edward; Cruse, Patricia; Laurel, Haak; Warner, Simeon. ORG ID WG Governance Principles and Recommendations. Figshare. 2017.
https://doi.org/10.23640/07243.5402002.v1, (accessed 2020-05-13).
(6) Laurel, Haak et al. ORG ID WG Product Principles and Recommendations. Figshare. 2017.
https://doi.org/10.23640/07243.5402047.v1, (accessed 2020-04-16).
(7) Laurel, Haak et al. Organization Identifier Project: Request for Information.Figshare. 2017.
https://doi.org/10.23640/07243.5458162.v1, (accessed 2020-04-16).
(8) California Digital Library et al. “The ROR of the crowd: get involved!”. ROR. 2018-12-02.
https://ror.org/blog/2018-12-02-the-ror-of-the-crowd/,(accessed 2020-04-16).
(9) “About”. ROR.
https://ror.org/about/, (accessed 2020-04-16).
(10) GRID-Global Research Identifier Database.
https://grid.ac/, (accessed 2020-04-16).
(11) “supporters”. ROR.
https://ror.org/supporters/, (accessed 2020-04-16).
(12) DataCite.
https://datacite.org/, (accessed 2020-04-16).
(13) Dryad.
https://datadryad.org/, (accessed 2020-04-16).
(14) Gould, Maria. “ROR-ing Together in Portugal: A Community Celebration”. ROR. 2020-02-10.
https://ror.org/blog/2020-02-10-ror-ing-in-portugal/, (accessed 2020-04-16).
(15) Feeney, Patricia. “You’ve had your say, now what? Next steps for schema changes”. Crossref. 2020-04-02.
https://www.crossref.org/blog/youve-had-your-say-now-what-next-steps-for-schema-changes/, (accessed 2020-04-16).
(16) Bilder, Geoffrey; Brown, Josh; Demeranville, Tom. Organisation identifiers: current provider survey. ORCID. 2016.
https://orcid.org/sites/default/files/ckfinder/userfiles/files/20161031%20OrgIDProviderSurvey.pdf, (accessed 2020-04-16).
(17) “Funder Registry”. Crossref.
https://www.crossref.org/services/funder-registry/, (accessed 2020-04-16).
(18) 一例としてはScholarOne Manuscriptsが挙げられる。
“ScholarOne Partner Program”. Clarivate.
https://clarivate.com/webofsciencegroup/solutions/scholarone-partner-program/, (accessed 2020-05-13).
(19) ISNI.
http://isni.org/, (accessed 2020-04-16).
(20) Ringgold Inc.
http://www.ringgold.com/, (accessed 2020-04-16).
(21) PSI.
http://www.publishersolutionsint.com/, (accessed 2020-04-16).
(22) 科学技術・学術政策研究所. 大学・公的機関名辞書ver2019.1. 文部科学省科学技術・学術政策研究所ライブラリ. 2019.
http://doi.org/10.15108/data_rsorg001_2019_1, (参照 2020-04-16).
(23) Gould, Maria. “A Reflection on ROR’s First Year”. ROR. 2019-12-17.
https://ror.org/blog/2019-12-17-year-in-review/, (accessed 2020-04-16).
(24) “supporters”. ROR.
https://ror.org/supporters/, (accessed 2020-04-16).
(25) Gould, Maria. “ROR-ing Together in Portugal: A Community Celebration”. ROR. 2020-02-10.
https://ror.org/blog/2020-02-10-ror-ing-in-portugal/, (accessed 2020-04-16).
(26) Cheng, Estelle et al. “ORCID in the Asia-Pacific Region: Involve, Engage, Consolidate”. ORCID. 2019-05-17.
https://orcid.org/blog/2019/05/31/orcid-asia-pacific-region-involve-engage-consolidate, (accessed 2020-05-13).
[受理:2020-05-27]
中島律子. 組織IDの動向−RORを中心に. カレントアウェアネス. 2020, (344), CA1976, p. 7-9.
https://current.ndl.go.jp/ca1976
DOI:
https://doi.org/10.11501/11509686
Nakajima Ritsuko
Overview of Organization Identifiers – with a Focus on ROR