PDFファイルはこちら
カレントアウェアネス
No.301 2009年9月20日
CA1693
動向レビュー
オープンアクセスは被引用数を増加させるのか?
1. オープンアクセス効果は神話か
オープンアクセス(以下、OA)を支持・推進する論拠の一つとして、「OA論文は非OA論文よりも頻繁に引用される」というものがある。つまり、インターネットに接続可能であれば誰でも読むことができる論文は、オンライン上に無いあるいは契約上読むことができない論文よりも頻繁に読まれ引用される、という主張である(ここでは、これを「オープンアクセス効果(以下、OA効果)」と呼ぶことにする)。分野に関わらず研究者が電子ジャーナル(以下、EJ)で学術雑誌論文を入手するようになったこと(1)、EJの閲読可能性は所属機関の図書館の契約状況に依存しかつ機関間格差があることを考慮すれば、この主張は一見理にかなっているように思われる。
2001年にローレンス(Steve Lawrence)(2)によって初めてのこのテーマに関する論文が発表されて以来、現在までに多くの調査研究が行われ、文献リスト(3)やレビュー論文(4)も執筆されている(CA1559、CA1684参照)。表は、これまでに行われた代表的調査をまとめたものだが、これらの調査結果は、OA効果の有無をめぐって一種の論争を生み出している(5)。OA効果が確かなものであり、自ら執筆した論文が多くの人に読まれることを研究者が望んでいるとすれば、論文をOAにすることはその要望を実現する望ましい手段として推奨される。たとえば、ハーナッド(Stevan Harnad)はこの立場の代表的人物である。一方で、デイビス(Philip M. Davis)のように、より厳密な調査方法をとればOA効果は認められないとする立場のものもいる。現時点でもOA効果の有無について結論は出ていないが、ここではOA効果論争を網羅的に扱うのではなく、より最近の動向かつ中心的問題に焦点を絞り、いくつかの代表的な調査に言及しながらこの論争を整理したい。
表 オープンアクセス効果に関する先行研究
2. 相関関係か因果関係か
OA効果論争の最大の争点は、「オープンアクセス」が原因で「論文の被引用数の増加」が結果、という因果関係が本当に成立しているかということだと思われる。ローレンスらの初期の調査は、OA論文と非OA論文それぞれの被引用数を算出しその比率はOA論文の方が高いと指摘しているが、見いだしているのはあくまでOAと論文の被引用数との相関関係であり、因果関係までをも示すものではない。論文の被引用に影響を与えうる多数の要因があることを考慮すれば、OAと被引用数だけを見ていてもOA効果を主張することには無理がある。
2.1 調査方法上の問題
こうした多様性を過度に単純化せず整理したのが、カーツ(Michael J. Kurtz)らである(11)。カーツらは、OA効果の要因を、1)オープンアクセス仮説(Open access)、2)早期アクセス仮説(Early access)、3)自己選別仮説(Self-selection)の、非排他的な3要因に区別している。オープンアクセス仮説は、論文へのアクセスに制限がないためより容易に読むことができ従ってより頻繁に引用されること、早期アクセス仮説は、論文が公式に刊行される前にプレプリントサーバ等で公表されるためその分引用されうる機会が増えること、自己選別仮説は、著名な研究者が論文をOAにするあるいはより重要な論文ほどOAにすることをそれぞれ意味している。カーツらによって示されたこの3要因は、以後の研究の枠組みを方向付けた重要なものである。
2005年に発表されたカーツらの研究以前のものが、調査方法上ある意味素朴なものであったのに対し、それ以後の調査研究はOA以外の要因を考慮するとともに多変量解析など、より統計的に頑健な手法によって、OA効果の有無を検証しているところに大きな特徴がある。その代表例として、アイゼンバッハ(Gunther Eysenbach)(12)、ムード(Frank Moed)(16)、デイビス(17)の調査があり、以下では各調査を簡単に紹介する。
2.2 交絡因子
医療情報学の研究者であるアイゼンバッハの調査は、疫学という方法論に基づき、交絡因子を考慮した研究デザインに最大の特徴がある。交絡因子とは、「原因および結果の両者と関連しているもの」(22)を指す。彼は、これまでのOA効果調査は、セルフアーカイブされたあるいはWeb上に無料公開されている論文を対象としており、調査上の問題点として、a)要因と結果を同時に観察する横断研究であること、b)早期アクセスなど他の要因を考慮していないこと、c)交絡因子の調整を考慮していないので誤った結果を導いている可能性があること、を指摘している。そこでアイゼンバッハは、ハイブリッド型OAジャーナルである米国科学アカデミー紀要(PNAS)に掲載された論文を対象に前向きのコホート研究(論文をOAと非OAに分けた後に、将来生じる被引用数を追跡すること)を行った。彼は、著者および論文に関する変数(著者の所属機関の国、論文発表件数、著者の1論文あたりの平均被引用数、論文の公開経過日数、主題領域、共著者数など)といった交絡因子を調整して、OAの方が将来の被引用数が多くなるという仮説の検証を行った。その結果、既知の交絡因子を調整してもOAが被引用数の多さに有意に影響を与えていることを示した(ただし、他の要因も同様であり、OAが主要な要因であるかまでは示されていない)。
2.3 ビブリオメトリックス
引用分析で著名なムードの調査は、ハーナッドらの調査手法に基づいているものの、カーツらの3要因をビブリオメトリックスの手法によって分析しているところに特徴がある。クレイグ(Iain D. Craig)らは、ムードの調査は被引用数の計測期間を固定した初めての調査であると指摘している(4)。つまり、たとえば調査時点で10年前の論文と1年前の論文では、前者の被引用数が多くなる可能性は高いわけであり、刊行年に関わらず同じ条件の下で被引用数を計測している。
調査では、物性物理学の学術雑誌に掲載された論文を対象に、プレプリントサーバarXivに登録された論文と登録されていない論文を比較している。結果として、arXivに登録された論文は登録されていない論文よりも被引用数が多かったが、それは論文がOAになっているためではなく、OA論文が早期に公開されていること・より引用される論文を執筆している著者が多いためであると述べている。
2.4 ランダム化比較試験
デイビスの調査の最大の特徴は、ランダム化比較試験(RCT)を行っていることである。RCTとは、医学分野でよく用いられる方法で「対象患者を無作為に2分に割りつけて、2つの治療法の効果を比較する方法」(22)であり、たとえば、新しい薬が、従来の薬と比較して優れているのか調べる際などに用いられる。ここでは、治療法がOAで、対象患者は論文である。デイビスは、先行研究では(過去にさかのぼって調査する)「後ろ向き観察研究の手法をとっているため、自己選別のバイアスを排除できていない」として、研究の結果が真実を反映している可能性が最も高い(22)RCTを行った。具体的には、米国生理学会の協力を得て、同学会が刊行しウェブサイトでEJとして提供している雑誌に掲載された論文がOAになるかどうかを無作為に割り当て、その後のOA論文と非OA論文のダウンロード数と被引用数の差を比較している。結果として、刊行1年後において、OAは論文のダウンロード数に統計的に有意な差をもたらしているものの、被引用数には有意差は見られないことが指摘されている(同時に、セルフアーカイブされた論文も(つまり、自己選別仮説)、被引用数に有意差がない)。
ただし、RCTというエビデンスレベルの高い調査手法を用いているデイビスの調査に対して、研究結果を発表するのが早すぎたのではないかという調査手法上の問題と倫理的な問題が指摘されている(23)。たとえば、アイゼンバッハは、RCTの対象となった論文が発表されてから1年後(より正確には9-12か月後)に被引用数を計測することは、対象論文(A)が別の論文(B)に引用され、その論文(B)がWeb of Scienceに索引される期間を考えると時期尚早で、4年計画にも関わらず1年目にネガティブな結果をなぜ公表したのかと指摘している。指摘に対して、デイビスはさらに6か月後の分析結果でも有意差はないことを報告しているが、今後も継続して調査をすると述べている。
3. オープンアクセスは何をもたらしたのか
これまで述べてきた論点を図にまとめた。この図から、OAと被引用数との間には、考慮しなければならない多数の要因が複雑に関係していることは明らかで、論文がOAであるかどうかと被引用数だけを見ていてはもはや不十分である。たとえば、エヴァンス(James A. Evans)は、OAは北半球の先進国よりも南半球の途上国の著者の引用行動に影響を与えていることを指摘している(21)。これは利用者の予約購読状況を反映した結果であると考えられるが、利用者のログ分析と組み合わせた調査研究はまだ見られない。ほかにも、被引用数の計測について、代表的なツールであるWeb of Scienceによる被引用数の計測は、収録対象外の学術雑誌における引用までを捉えられない問題もある。ランシン(Van C. Lansingh)らは,Web of Scienceではなく、ScopusとGoogle Scholarを利用して被引用数を計測している(20)。
図 オープンアクセス効果に関わる諸要因
現時点で言えるのは、OA論文はより頻繁にダウンロードされ引用されることもあるが、被引用数に関してはOAはその原因であると言い切れない、ということであろう。つまりOA論文の持つ無料でアクセスできること以外の要因が被引用数に影響を与えている可能性があるということである。
この10年弱で20前後の調査研究が行われていることを考慮しても、現在までに発表されている調査結果からは、学問分野間の違いや調査方法の不統一により、OAは論文の被引用数を高めるという主張の一般化は困難であると考えられる。論文の入手経路は、学術情報流通の電子化が進むにつれて多様な手段が開発されており、調査研究ごとに条件の統一が困難になってしまう。今後このテーマの研究を行う場合、より厳密な研究デザインを設計することを前提に分野ごとに調査を行う必要があるだろう。ハーナッド(24)、アイゼンバッハ(25)、デイビスは現在も調査を継続あるいは新しい調査を実施しており、それらの結果が公表されることが待たれる。日本でも、日本化学会(26)のOAオプション(Open Access Option)利用論文を対象とした事例や日本動物学会(27)の機関リポジトリ登録論文を対象とした事例の調査が行われており、その結果が期待されるところである。
名古屋大学:三根慎二(みね しんじ)
謝辞:慶應義塾大学医学部衛生学公衆衛生学教室の道川武紘先生からは,疫学関連の表現について大変有益なコメントを頂きました。御礼申し上げます。
(1) 学術図書館研究委員会. “学術情報の取得動向と電子ジャーナルの利用度に関する調査(電子ジャーナル等の利用動向調査2007)”.
http://www.screal.org/apache2-default/Publications/SCREAL_REPORT_jpn8.pdf, (参照 2009-07-21).
(2) Lawrence, Steve. Free online availability substantially increases a paper’s impact. Nature. 2001, 411(6837), p. 521.
(3) “The effect of open access and downloads (‘hits’) on citation impact: a bibliography of studies”. The Open Citation Project.
http://opcit.eprints.org/oacitation-biblio.html, (accessed 2009-07-21).
(4) Craig, Iain D. et al. Do Open Access Articles Have Greater Citation Impact?: A critical review of the literature. Journal of Informetrics. 2007, 1(3), p. 239-248.
(5) De Bellis, Nicola. “8.2.1 Citation and Open Access”. Bibliometrics and Citation Analysis: From the Science Citation Index to Cybermetrics. Scarecrow Press. 2009, p. 291-300.
(6) Anderson, Kent et al. Publishing Online-Only Peer-Reviewed Biomedical Literature: Three Years of Citation, Author Perception, and Usage Experience. The Journal of Electronic Publishing. 2001, 6(3),
http://dx.doi.org/10.3998/3336451.0006.303, (accessed 2009-07-21).
(7) Schwarz, Greg J. et al. Demographic and Citation Trends in Astrophysical Journal Papers and Preprints. Bulletin of the American Astronomical Society. 2004, 36(5), p. 1654-1663.
(8) Harnad, Stevan et al. Comparing the Impact of Open Access (OA) vs. Non-OA Articles in the Same Journals. D-Lib Magazine. 2004, 10(6),
http://www.dlib.org/dlib/june04/harnad/06harnad.html, (accessed 2009-07-21).
(9) Antelman, Kristin. Do Open-Access Articles Have a Greater Research Impact? College & Research Libraries.2004, 65(5), p. 372-382.
(10) Hajjem, Chawki et al. Ten-year Cross-Disciplinary Comparison of the Growth of Open Access and How it Increases Research Citation Impact. Bulletin of the IEEE Computer Society Technical Committee on Data Engineering. 2005, 28(4), p. 39-47.
(11) Kurtz, Michael J. et al. The Effect of Use and Access on Citations. Information Processing & Management. 2005, 41(6), p. 1395-1402.
(12) Eysenbach, Gunther. Citation Advantage of Open Access Articles. PLoS Biology. 2006, 4(5), e157,
http://www.plosbiology.org/article/info:doi/10.1371/journal.pbio.0040157, (accessed 2009-07-21).
(13) Metcalfe, Travis S. The Rise and Citation Impact of astro-ph in Major Journals. Bulletin of the American Astronomical Society. 2005, 37(2), p.555-557.
(14) Metcalfe, Travis S. The Citation Impact of Digital Preprint Archives for Solar Physics Papers. Solar Physics. 2006, 239(1‒2), p. 549-553.
(15) Davis, Philip M. et al. Does the arXiv lead to higher citations and reduced publisher downloads for mathematics articles?. Scientometrics. 2007, 71(2), p. 203-215.
(16) Moed, Henk F. The Effect of “Open Access” on Citation Impact: An Analysis of ArXiv’s Condensed Matter Section. Journal of the American Society for Information Science and Technology. 2007, 58(13), p. 2047-2054.
(17) Davis, Philip M. et al. Open access publishing, article downloads, and citations: randomised controlled trial. BMJ: British Medical Journal. 2008, 337, a568.
http://www.bmj.com/cgi/content/full/337/jul31_1/a568, (accessed 2009-08-10).
(18) Davis, Philip M. Author-Choice Open-Access Publishing in the Biological and Medical Literature: A Citation Analysis. Journal of the American Society for Information Science and Technology. 2009, 60(1), p. 3-8.
(19) Norris, Michael et al. The Citation Advantage of Open-Access Articles. Journal of the American Society for Information Science and Technology. 2008, 59(12), p. 1963-1972.
(20) Lansingh, Van C. et al. Does Open Access in Ophthalmology Affect How Articles are Subsequently Cited in Research?. Ophthalmology. 2009, 116(8), p. 1425-1431.
(21) Evans, James A. Open Access and Global Participation in Science. Science. 2009, 323(5917), p. 1025.
(22) 日本疫学会編. 疫学:基礎から学ぶために. 東京, 南江堂, 1996, 255p.
(23) “Rapid Responses for Davis et al., 337 (jul31_1) 568”. BMJ.
http://www.bmj.com/cgi/eletters/337/jul31_1/a568, (accessed 2009-07-21).
(24) Hajjem, Chawki et al. “The Open Access Citation Advantage: Quality Advantage Or Quality Bias?”. arXiv.org.
http://arxiv.org/abs/cs/0701137, (accessed 2009-07-21).
(25) “Role of open access to research results in knowledge translation”. Canadian Research Information System.
http://webapps.cihr-irsc.gc.ca/funding/detail_e?pResearchId=1543037&p_version=CIHR&p_language=E&p_session_id=624329, (accessed 2009-07-21).
(26) 林和弘. 日本のオープンアクセス出版活動の動向解析. 情報管理. 2009, 52(4), p. 198-206.
(27) “Zoological Science meets Institutional Repositories”. DRF wiki.
http://drf.lib.hokudai.ac.jp/drf/index.php?Zoological%20Science%20meets%20Institutional%20Repositories, (accessed 2009-07-21).
三根慎二. オープンアクセスは被引用数を増加させるのか?. カレントアウェアネス. 2009, (301), CA1693, p. 7-10.
http://current.ndl.go.jp/ca1693