E1195 – 雑誌論文のコンテンツマイニング,その現状と課題

カレントアウェアネス-E

No.197 2011.07.28

 

 E1195

雑誌論文のコンテンツマイニング,その現状と課題

 

 英国出版社協会(Publishers Association)等が構成メンバーである,出版研究コンソーシアム(Publishing Research Consortium)が“Journal Arcicle Mining: A research study into Practices, Policies, Plans…..and Promises”と題するレポートを公表した(2011年5月付け)。レポートは,学術雑誌論文を対象としたコンテンツマイニングの現状を調査したものである。コンテンツマイニングとは,情報検索・情報抽出・メタ分析を目的として行われる,大量のデジタルコンテンツの自動処理を意味する。調査は,コンテンツマイニングに携わる専門家29名のインタビューや,国際STM出版社協会等の加盟出版社へのメール調査(回答数190件)をもとにまとめられている。ここではレポートの要約部分から,その調査結果の一部を紹介する。

●コンテンツマイニングの発展

  • コンテンツマイニングは日進月歩の世界であり,新たな分野(社会科学,人文科学,ビジネス・マーケティング,法律関係)に浸透してきている。
  • 回答社全体の77%(大規模出版社の88%)が著者以外の研究者等からマイニングの許諾依頼を受けている。その数は1年に10件以下,研究目的では1年に5件以下だが,回答社の半数がマイニングの要望は増加傾向にあると回答している。

●コンテンツマイニングについての出版社による許諾について

  • 回答社の32%が許諾不要で目的不問のマイニングを認めており,そのうち28%がマイニングに関するオープンアクセス方針を定めている。他方で,68%はマイニングに対して許諾を与えるのはケースバイケースであるとしている。
  • マイニングの要望があったとき,35%の回答社は大抵許諾している。
  • マイニングの希望が自社製品やサービスと相容れないものであれば,51%の回答社は許諾を与えないとしている。ただし,研究目的のマイニングは,その90%が出版社から許諾されている。

●コンテンツマイニングの実践

  • 回答した出版社の46%が自社のコンテンツのマイニングを行っている。
  • 図書館は,コンテンツマイニングの実施に対して許諾を与える立場にあるが,それに加えて,マイニングを行うためのプラットフォームを提供できるようになりたいと考えている。また図書館はマイニングに関する著作権規定を明確なものにするよう,出版社に求めている。

●コンテンツマイニングの促進における障害とその対応

  • 回答社の50%近くは,オープンアクセスがマイニングにおいて必須のものとは考えていないが,30%は不可欠なものと捉えている。
  • 出版社は,マイニングに適したコンテンツフォーマットの標準化,コンテンツマイニングプラットフォームの共通化,コンテンツマイニングのための許諾ルールの統一という3つを,コンテンツマイニング促進に向けた対策の上位に挙げている。
  • 出版社は,図書館によるコンテンツマイニングプラットフォームの構築をほとんど支持していない。マイニングの専門家も,マイニングに関して図書館と協同することには消極的である。

Ref:
http://www.publishingresearch.net/documents/PRCSmitJAMreport20June2011VersionofRecord.pdf