研究機関情報のレジストリから集約したデータの曖昧さに対処するOpenAIREの新ツール“OpenOrgs”(記事紹介)

OpenAIREの2021年10月8日付け記事で、新たに開発を進めているツール“OpenOrgs”が紹介されています。

同一研究機関の情報であっても、データソースによって名称表記、機関識別に用いているPIDスキーマ(ROR、ISNIなど)、その他メタデータが異なる場合があります。このような曖昧さは各データソースからのデータ集約時に大きな影響をもたらすことになります。

研究機関情報のレジストリから“OpenAIRE Research Graph”へのデータ集約においてもこの問題が発生するとし、その対処のためにOpenOrgsが開発されました。OpenOrgsは、アルゴリズムによってメタデータに類似性がある機関を重複分としてグループ化した後、キュレーターの確認によって同一機関かどうか判定するという二つのステップで機能します。また、アルゴリズムでは検出できなかった重複分の手動追加や、メタデータの追記等も可能とあります。

なお、2021年9月のOpen Science FAIRでOpenOrgsとその機能に関するデモセッションが開催されており、YouTube上で記録動画が公開されています。

OpenOrgs: the OpenAIRE service for bridging registries of research organisations(OpenAIRE, 2021/10/8)
https://www.openaire.eu/openorgs-the-openaire-service-for-bridging-registries-of-research-organisations

OpenOrgs: the OpenAIRE tool for bridging registries of research organizations(Open Science FAIR)
https://www.opensciencefair.eu/2021/demos/openorgs-the-openaire-tool-for-bridging-registries-of-research-organizations
※Open Science FAIRで開催された、OpenOrgsとその機能に関するデモセッションのウェブページです。YouTube上の記録動画へのリンクも掲載されています。

参考:
Digital Science社、オープンな組織IDとしてのGRIDの役割をRORに引き継ぐと発表
Posted 2021年7月14日
https://current.ndl.go.jp/node/44422

CA1976 – 組織IDの動向−RORを中心に / 中島律子
カレントアウェアネス No.344 2020年6月20日
https://current.ndl.go.jp/ca1976