なぜトムソン・ロイター社は論文被引用数の中央値をJournal Citation Reportsに掲載しないのか(記事紹介)

一般に大人のヘラジカの背の高さのような、正規分布すると考えられるデータであれば平均値を算出することに意味がありますが、学術文献の被引用数のような偏りが大きく正規分布しないデータについては、平均値ではなく中央値を算出した方がサンプルの傾向を知るのに適しているとされています。しかし雑誌の評価指標としてよく知られたインパクトファクターは、過去2年間の掲載論文の被引用数の平均値を算出したものです。そこで被引用数の平均値ではなく、中央値を算出して欲しいという意見がしばしば上がりますが、未だに実現していません。その理由を解説する記事が、2016年4月12日付けで学術出版に関するブログ”the scholarly kitchen”に掲載されています。著者はPhil Davis氏です。

Davis氏はインパクトファクターを算出しているトムソン・ロイター社のデータベース、Web of Scienceを用いて、実際にある雑誌に掲載された論文の被引用数の中央値を算出してみせています。しかしWeb of Scienceのデータを使えば個人でも簡単に算出できそうな被引用数中央値を、トムソン・ロイター社が算出しないのにはわけがあると述べます。それは多くの論文の著者が、雑誌名等を誤った表記にしたままで引用を記述しているために、Web of Science上の被引用数のデータは正確ではないことに起因しています。正確な被引用数を算出するために、インパクトファクターが掲載されているJournal Citation Reports(JCR)においては、トムソン・ロイター社は雑誌名等の表記ぶれを見直して計算し直しているのですが、その際に雑誌名と出版年のみを確認・集計しているため、JCRは雑誌全体のある年の被引用数を対象にしたもので、個別論文の被引用数の集計には基づいておらず、そのため、個別論文の被引用数データが必要な中央値は算出できないのであるとDavis氏は解説しています。

On Moose and Medians (Or Why We Are Stuck With The Impact Factor)(the scholarly kitchen、2016/4/12付け)
https://scholarlykitchen.sspnet.org/2016/04/12/on-moose-and-medians-or-why-we-are-stuck-with-the-impact-factor/

参考:
インパクトファクターに物申す!
Posted 2006年7月7日
http://current.ndl.go.jp/node/4236