CA2085 – 動向レビュー:PMCの動向:オープンアクセスリポジトリのベストプラクティスとして / 山口直比古

PDFファイル

カレントアウェアネス
No.364 2025年06月20日

 

CA2085
動向レビュー

 

PMCの動向:オープンアクセスリポジトリのベストプラクティスとして

聖隷佐倉市民病院図書室:山口直比古(やまぐちなおひこ)

 

1. PMCのはじまり

 PMCは生物医学・生命科学分野を対象とするオープンアクセス(OA)リポジトリである。2000年にPubMed Centralとしてスタートしている。その成り立ちについてはウェブサイトのURLを見るとよくわかる。URLはhttps://pmc.ncbi.nlm.nih.gov/ であるが、これが示しているのは、米国政府(gov)の研究機関である国立衛生研究所(National Institutes of Health:NIH)の一機関である国立医学図書館(National Library of Medicine:NLM)が設立し、研究開発組織である国立生物工学情報センター(National Center for Biotechnology Information:NCBI)が作成・提供する情報のリポジトリであるということである。このURLは、これまでhttps://ncbi.nlm.nih.gov/PMC であったが、2024年10月のリニューアルと同時に、上記のURLに変更された。このことはPMCが学術コミュニケーションの世界で、より大きな存在となったことを示しているといえる。

 当初PubMed Centralという名称でスタートしたが、NLMが作成し1997年に世界へ向けて無料で公開された医学文献データベースであるPubMedとの名称の混同を避ける意味で、PMCと通称されるようになった。

 PMCを作成・提供しているNCBIは、元々は遺伝子関連の情報を集め、統合的に提供するためのデータベース作成が主な役割であった。NCBIのデータベースは新型コロナウイルス同定の際にも使用され、ワクチンの開発にも貢献している。同時に検索システムの開発も行っており、PubMedや遺伝子データベースであるGenBankなどを検索するEntrezと名付けられたシステムの開発も行っている。さらに、NIHが提供する研究費による研究の発表の場としてのPMCの開発・提供も行っている。詳しくは次節で紹介するが、基本的には国民の税金で研究開発された成果は、ただちに無料で国民(世界の人々)に公開されるべきである、ということである。

 

2. PMC登場の背景

 研究成果を広げるための方法としては、学術雑誌に論文として掲載するのが一般的な方法であった。しかし、論文審査に要する時間(数か月から数年)や、論文の投稿料、図書館での雑誌購入費の高騰などのいくつかの問題も抱えている。こうした状況に対処するため、NLMは医療情報の中心的流通機関としての役割を果たすための方策をとった。それは、学術コミュニケーションのモデルが変化し、オープンアクセス(OA)やプレプリントが登場してきた時代の反映でもあった。

 PMCがOAのプラットフォームとしての役割を果たすに至ったいくつかの背景について見てみる。

 

2.1 情報を全ての人々に ―米国政府の方針―

 1984年病理学者であり情報工学も学んでいたリンドバーグ(Donald A.B. Lindberg)がNLMの館長となり、周到な準備の後1987年に長期計画を策定した。この中の目標2.4として「市民の健康情報ニーズとアクセスの検討」という項目を挙げ、市民の情報へのアクセスを支援するためにオンラインデータベースのディレクトリを提供する、としている(1)。一般市民には医学・医療情報の需要があるにもかかわらず、現状では必ずしも適切に提供はされていないため、改善すべきであると自覚していたのである。このことは、1997年のPubMed無料公開へ繋がっていくのだが、情報を市民へ公開していくというNLMの一貫した方針が確立していく。

 情報の公開へ向けた具体的な政策としての現れが、2004年のNIHのPublic Access Policy(CA1600参照)であった。内容は、NIHの研究費助成を受けた研究はOAで公開するというものであるが、目的はPublic Access Policyのページで次のように説明されている。

 「国立衛生研究所(NIH)の資金から生まれた出版物へのアクセスを増やすことは、基礎となる研究に資金を提供した科学コミュニティと一般の人々に多くの利益をもたらす。患者、家族および医療提供者がNIHの資金提供から生じる公表された調査・研究結果にアクセスできることにより、社会が直面している最も重要な健康上の懸念をよりよく理解し、対処することができる。また、全てのコミュニティの研究者、学生、および一般市民がそのようなコンテンツに公平にアクセスできるようにすることもできる。―中略― これらの目標は、研究への信頼を育むための不可欠な要素である。また、納税者が資金提供する研究の透明性とアクセシビリティを改善することにより、生物医学研究への投資に対する国の責任ある管理に対するNIHの関わりを反映している」(2)

 こうした方針の下で2008年には「査読後論文の出版から12か月以内にPMCで公開することを義務付ける」という内容であったものが、2013年など幾度かの改訂を経て、2022年には12か月という猶予が撤廃され、即時公開すると定められ(3)、2025年7月1日以降に受理された著者最終原稿をPMCに提出し、発行日の日付に関わらず即時公開すること、とする注記がホームページの最初に掲載された。

 研究費の助成機関はNIHに限らず、疾病管理センター(CDC)や食品医薬品局(FDA)などの米国内16機関の他、Europe PMC(後述)が収録対象とする助成機関も含まれている(4)。これらの機関はPMC検索画面の左欄にもResearch Funderとしてリストされており、助成金の出所により検索結果を絞り込むこともできる。

 

2.2 OAの登場と進行

 1990年代後半にインターネットが急速に世界に普及していった。同時に学術雑誌の電子ジャーナル化が進み、大学図書館などで導入が進んでいった。その頃の購読契約のビジネスモデルはビッグディールと呼ばれる一括契約(CA1586参照)で、当然ながら中にはあまり利用されない雑誌も含まれていた。出版社の提供する学術雑誌全体ということもあり、その代金は非常に高額なものであった。また、著者は雑誌への投稿料を支払い、図書館は電子ジャーナルを有料で購読するという二重の課金がなされるものであった。しかし、これはあまりに負担が大きく継続しての契約が困難となり、購読契約を中止する大学図書館などが急増していった。シリアルズクライシスと呼ばれる状況である。

 1999年ハンガリー・ブダペストでユネスコと国際科学会議(ICSU)の合同会議で「科学と科学的知識の利用に関する世界宣言」が採択された。これは後にOAを推奨する「ブダペスト宣言」としてまとめられている(5)。ここで推奨されたOAとは、無料かつ無制限のオンラインによる利用を意味するもので、論文を読むだけではなく、ダウンロード、コピー、配付、印刷、検索のためのリンクの作成、インデックス作成のための情報収集などの幅広い利用を含んでいるものであった。セルフアーカイブ(機関リポジトリによる公開など)も推奨している。2003年には英国のウエルカムトラスト、米国のロックフェラー財団、ドイツのマックスプランク研究所などがNIHのあるベセスダ(メリーランド州)に集まり、OAを推奨する「ベセスダ宣言」を発表している。

 こうした動きの中で、研究者が商業出版社の営利主義に反旗を翻し、オンラインのサイトを立ち上げ無料で論文を公開するという事業を開始した。2000年に設立されたPLoS(Public Library of Science:科学のための公共図書館;CA1433参照)である。PMCがスタートした半年後のことであった。そして2003年創刊のPLoS Biology、2006年創刊のPLoS Oneなど現在14誌のOA誌を出版している。

 OA誌のビジネスモデルは、基本的に「論文処理費用(APC)による収益により運営する」というもので、ゴールド、グリーンなどの色の名前を付けて区分されているが、投稿する研究者の側も利用者の側も無料とするダイヤモンドジャーナルという種類の雑誌も登場してきている。

 

2.3 プレプリントとプレプリントサーバー

 学術論文は、基本的には内容についての審査を受け、受理されたものが雑誌に掲載される。このことはPMCやOA誌においても変わりはない。しかし、いくつかの問題点もある。論文審査に時間がかかり公表までに数か月を要することや、論文審査は同じ研究分野の研究者が行うため、公平性や透明性に問題が生じる可能性があることなどである。新型コロナウイルス感染症によるパンデミックが世界を覆っている時、この病気の原因や治療についての情報が素早く公開されることが求められた。

 そうした中である日、日本の新聞に「査読前論文」による、という言葉を掲げて新型コロナウイルス感染症に関する記事が掲載された(6)。これは雑誌に投稿し、内容についての審査を受ける前の論文(プレプリント)、すなわち著者の原稿であることを意味している。こうした原稿を無料で公開できる場所がプレプリントサーバーである。1991年に米・ロスアラモス研究所に設けられたarXiv(アーカイブ)が最初のプレプリントサーバーであると言われているが、情報の早さが重要視される物理学の分野などでよく利用された。その後も生物学分野のbioRxiv(2013年)、医学分野のmedRxiv(2019年)など多くのプレプリントサーバーが作られていった。こうした傾向はプレプリントサーバーの第二の波と呼ばれた(7)

 プレプリントには、研究の早い段階で公開できる、幅広い研究者コミュニティからフィードバックを受けることができる、著者は無料で公開し読者も無料で読むことができる、などの利点がある(8)。一方で、審査を受ける前であるという点から、間違いなどもあり論文撤回が比較的多い、という面もある。

 PubMedを作成・提供しているNLMでは、網羅的に情報を集めるという観点から、2020年よりプレプリントを積極的に収載するPreprint Pilotというプログラムを進めており(9)、PubMedで文献検索をすると多くのプレプリントがヒットする。その後審査を経て雑誌に掲載されるとデータにその旨表示される。

 しかし、プレプリントはあくまでも審査前の著者原稿であり、投稿・審査を受け雑誌に掲載された論文とは異なるため、審査前の論文を発表する場としてのプレプリントサーバーの役割は審査後の論文をアーカイブし保存や公開を行うPMCとは異なっている。

 

3. PMCの現在

 PMCには、2025年4月2日現在1,078万4,271件の論文が収録されている。最近では、年間およそ80万件程度の論文が新規に収録されている。また、PMCは必ずしも最新の論文ばかりではなく、過去に遡っても収録しており、最も古い論文では1700年代後半のものもある。年毎の新規収録件数は図に示したとおり、増加する傾向にある。PMCはPubMedにも収録されており、PubMedでも検索できるが、PubMedの最近の年間収録件数は160万~170万件であるので、およそ半数をPMCのデータが占めていることになる。

 

図 PMCの新規収録件数(各年)PubMedのデータを基に筆者が作成

 

3.1 PMCが収録している論文

 PMCにはNIHなどの研究費助成金を受けた研究が収録されていることはすでに述べた。しかしそれらの研究論文は様々な雑誌に掲載される。PMCにはOAリポジトリとしての役割を果たすために、一定の収録基準を満たした雑誌や、それらの収録誌以外に掲載された論文が収録されている。雑誌単位で収録されるには、幾つかの基準があり、それらの審査はNLMの図書館員も加わった選定委員会が行っている。選定の基準は、内容的な良し悪しよりは、形式的なものが多い。以下のようなものである(10)

  • ISSNを持っている
  • XMLで作られている(すぐに電子データとして本文を掲載できるように)
  • 主題領域が生命科学分野である
  • 英文誌である(英語のウェブサイトが公開されている)
  • 創刊から2年以上経過している(継続的に出版されている)
  • 査読済みの論文を年間25論文以上掲載している

 また、一度審査に落ちると2年間再申請することができない、といったルールもある。これらの基準を満たし、収録誌とされているものが、全論文収録誌や該当論文のみ収録するものなど合わせてPMC Journal Listには4,350誌ほどリストされている(11)。PubMedの収録誌と重なっている雑誌も相当数あるが、PubMed収録誌数が5,200誌ほどであるので、かなり大きな数字と言える。余談にはなるが、千葉大学医学部の『千葉医学』誌が、PMCへ登録申請をした際の経験談は興味深い(12)

 研究費の助成を受けているが、上記のようなPMC収録誌ではない雑誌に掲載された論文も当然収録対象となる。この場合は、出版社や著者からの申し出により収録されることになる。収録された全ての論文にPMCの固有IDである7桁のPMCIDが付与される。PubMedの収録誌、PMCの収録誌などはNLMの所蔵となっているので、NLM Catalogで詳細な情報を調べることができる(13)

 

3.2 PMC論文を検索する

 PMC論文はPMCのサイトから検索することができる。PMCのトップページにある検索ボックスにキーワードを書き込んで、サーチボタンを押すだけである。もちろんそれでもよいのだが、PMCに収録されている論文は全てPubMedに収録されているので、特定の主題で論文を探す場合にはPubMedで検索する方がより網羅的に探すことができる。

 PMCのサイトで検索することの利点は、全てにフルテキストリンクが付いており、すぐに論文を読むことができる、という点にある。検索のオプションなどは、ほぼPubMedでの検索に近い方法を使用することができる。詳しい説明はPMC User Guideにある(14)

 PubMedでは論文の主題分析を行った上で、索引語としてMeSH(Medical Subject Headings)という統制語が付与されるので、検索性能が向上するという利点がある。しかし、PMCの論文にはMeSHが付与されないままPubMedに収録される論文も一定数あるので、MeSHに加えてフリータームで検索する必要もある。PMCホームページのNew in PMCのニュースによると、2025年中には検索システムのリニューアルが予定されており、近接演算子が利用できるようになるなど、よりPubMedに近い検索システムとなる(15)。いずれにしろ、PMCの利点をよく知ったうえで検索に臨むのが良いだろう。場合によってはPubMedで検索する方がより幅広い結果を得られる可能性もある。

 

4. 世界のOAリポジトリ

 PMCの考え方は、世界へ広まっている。中でもEurope PMCはその名のとおり欧州におけるPMCの役割を果たしている。2007年EMBL-EBI(European Molecular Biology Laboratory-European Bioinformatics Institute)によりOAリポジトリとして設立されたが、欧州の多くの研究費助成機関との共同でもあった(16)。査読論文の他にプレプリントも含み、2025年4月4日現在4,581万9,445件の論文を収録している。このうちおよそ900万件はフルテキストにリンクしており、すぐに論文を読むことができる。また、34に及ぶプレプリントサーバーのデータを含んでいることも大きな特徴となっている(17)

 同様の動きは日本にもある。2023年5月広島でG7サミットが開催されたが、その一部である科学技術大臣会合が仙台で開催された。そこで国レベルでのOAに関する方針が策定され、2024年2月に内閣府より「学術論文の即時オープンアクセス実現に向けた基本方針」が公開された(18)。次いで、4月には「日本の学術論文等のオープンアクセス政策について」と題する資料も発表された(19)。これはPMCのようなOAリポジトリを構築するというよりは、助成を受けた研究結果の機関リポジトリによる即時公開という面が強いが、国内では実績のある国立情報学研究所(NII)や科学技術振興機構(JST)との連携を図り具体化していくことになると思われる。2025年の実施をうたっており、Jxiv(ジェイカイブ)というJSTのプレプリントサーバーや、各大学等の機関リポジトリでの公開が想定される。

 この他にも、2018年から欧州の研究費助成機関(当初は15機関)の補助を受けた研究を、即時OAで公開することを推奨(義務付ける)するcOAlition SによるPlan S(E2764参照)も知られている。

 

5. PMCの今後

 2025年3月初めPubMedがダウンし、世界中の研究者を震撼させた。米国を中心とする医学図書館員のメーリングリスト(リストサーブ)であるMedlib-Lには、このことを憂慮する多くの投稿があった。Nature3月13日号のニュースでも紹介された(20)。幸い2日後には元に戻ったが、その間にもNIHの研究費助成金が大幅に制限されるなどの出来事があった。NIHの研究費助成金が停止や減額されることにより、研究発表も減少することが予想される。PMCの収録件数も減少する可能性がある。

 幸いにも、本稿執筆時(2025年4月初め)ではNLMはほぼその機能を維持し、PubMedへの論文収録もこれまでどおり進んでいる。NCBIの作成・提供している遺伝子関連のデータベースも更新されている。同様にNCBIの提供するPMCも動いている。

 現状では、PMCの明るい未来を想像することは難しいが、学術コミュニケーションの世界で果たしている役割は大きいので、情報を蓄積し、保存し、公開してゆく、そして「情報を世界の人々へ」というこれまでの方針が維持されることを祈っている。

 

(1)National Library of Medicine Long Range Plan. U.S. Department of Health and Human Services, Public Health Service, National Institute of Health. 1987, 67p.
https://digirepo.nlm.nih.gov/ext/dw/101646837/PDF/101646837.pdf, (accessed 2025-06-10).

(2)2024 NIH Public Access Policy.
https://grants.nih.gov/grants/guide/notice-files/NOT-OD-25-047.html, (accessed 2025-04-04).

(3)“Public Access Policy”. NIH Scientific Data Sharing.
https://sharing.nih.gov/data-management-and-sharing-policy, (accessed 2025-04-04).

(4)“PMC and Research Funder Policies”. PMC.
https://pmc.ncbi.nlm.nih.gov/about/public-access/, (accessed 2025-04-04).

(5)“Read the Declaration Budapest Open Access Initiative”. BOAI.
https://www.budapestopenaccessinitiative.org/read/, (accessed 2025-04-04).

(6)野中良祐, 瀬川茂子. “コロナで急増「査読前論文」世界で1万6千本以上”. 朝日新聞. 2021-07-14.
https://www.asahi.com/articles/ASP7F31M0P68PLBJ002.html, (参照 2025-04-04).

(7)Johnson, Bob; Chiarelli, Andrea. “The Second Wave of Preprint Servers: How Can Publishers Keep Afloat?”. Scholarly Kitchen. 2019-10-16.
https://scholarlykitchen.sspnet.org/2019/10/16/the-second-wave-of-preprint-servers-how-can-publishers-keep-afloat/, (accessed 2025-04-04).

(8)尾城孝一. 進化するプレプリントの風景. 情報の科学と技術 2020, 70 (2), p. 83-86.
https://doi.org/10.18919/jkg.70.2_83, (参照 2025-04-04).

(9)“NIH Preprint Pilot Accelerates and Expands Discovery of Research Results: Expansion of pilot planned for early 2023”. NIH. 2022-12-14.
https://www.nlm.nih.gov/news/NIH_Preprint_Pilot_Accelerates_Expands_Discovery_Research_Results.html, (accessed 2025-04-04).

(10)“How to Include a Journal in PMC”. NLM.
https://pmc.ncbi.nlm.nih.gov/pub/addjournal/, (accessed 2025-04-04).

(11)“PMC Journal List”. PMC.
https://pmc.ncbi.nlm.nih.gov/journals/, (accessed 2025-04-04).

(12)瀧口正樹. PMC(旧PubMed Central)収録申請の経過ご報告 -編集後記に代えて. 千葉医学. 2020, 96 (6), p. 147.

(13)“NLM Catalog”. NLM.
https://www.ncbi.nlm.nih.gov/nlmcatalog/, (accessed 2025-04-04).

(14)“PMC User Guide”. PMC.
https://pmc.ncbi.nlm.nih.gov/about/userguide/, (accessed 2025-04-04).

(15)“PubMed Central’s Updated Full-Text Search Preview Now Available”. PMC. 2025-04-17.
https://pmc.ncbi.nlm.nih.gov/about/new-in-pmc/#2025-04-17, (accessed 2025-05-14).
“PubMed Central (PMC) Transitions to Updated Website”. NLM Technical Bulletin. 2024-10-21.
https://www.nlm.nih.gov/pubs/techbull/so24/so24_PMC_Website_Updates.html, (accessed 2025-04-04).

(16)Rosonovski, Summer et al. Europe PMC in 2023. Nucleic Acids Research, 2024, 52 (D1), p. D1668-D1676.
https://doi.org/10.1093/nar/gkad1085, (accessed 2025-04-04).

(17)“Preprint servers indexed”. Europe PMC.
https://europepmc.org/Preprints#preprint-servers, (accessed 2025-04-04).

(18)統合イノベーション戦略推進会議. 学術論文等の即時オープンアクセスの実現に向けた基本方針. 2024, 3p.
https://www8.cao.go.jp/cstp/oa_240216.pdf, (参照 2025-04-04).

(19)内閣府 科学技術・イノベーション推進事務局. 日本の学術論文等のオープンアクセス政策について. 2024, 28p.
https://www8.cao.go.jp/cstp/oa_houshin_setsumei.pdf, (参照 2025-04-04).

(20)Mallapaty, Smriti.“‘OMG, did PubMed go dark?’Blackout strikes fears”. Nature, 2025, 639 (8054) :288.

[受理:2025-05-19]

 


山口直比古. 動向レビュー:PMCの動向:オープンアクセスリポジトリのベストプラクティスとして. カレントアウェアネス. 2025, (364), CA2085, p. 17-21.
https://current.ndl.go.jp/ca2085
DOI:
https://doi.org/10.11501/14434610


Yamaguchi Naohiko
Trends in PMC: As a Best Practice for OA Repositories