オープンアクセスなデータの課題(文献紹介)

2022年2月5日付で、医学誌“The Lancet”の399巻10324号に、短報“The challenges of open access data”が掲載されています。著者は英・ケンブリッジ大学のCarol Brayne氏らです。

短報では、アイルランドの研究プロジェクト“The Irish Longitudinal Study on Ageing”(TILDA)内において、TILDAが公開しているデータセットを利用した研究に関する調査が行われ、深刻な課題が特定されたことを紹介しています。

まず、いくつかの文献において、データの特性に対する不十分な理解、または分析におけるサンプリング方法等の不適切さが明らかになったこと等が報告されています。さらにソフトウェアの進歩によって、ハーキング(結果が判明した後に仮説を提示すること)の実践が容易になると述べられています。逆の順序で仮説を設計することができるようになるなどして、劣った研究が急増する可能性が指摘されています。

これらの課題に対して、データ管理者による利用者とデータの利用の適切な監視など、3つの提案がなされています。

Brayne, Carol, et al. The challenges of open access data. The Lancet. 2022, 399(10324), p. 517. https://doi.org/10.1016/S0140-6736(21)02721-5