CA1455 – 知識の管理と図書館情報学 / 岸田和明

カレントアウェアネス
No.270 2002.02.20

 

CA1455

 

知識の管理と図書館情報学

 

 筆者が中学生の頃,ある教師が「図書館の司書というのは図書館にある本をすべて知っているものだ」と言っていたのを,最近,ある機会にふと思い出した。その「図書館」が一般の図書館なのか,それともその中学の図書室を指していたものなのか,あるいは,「知っている」とは具体的にどの程度のレベルを意図していたのかなど,今となっては詳細はよくわからない。とにかくそれを聞いて,「図書館員の頭の中には図書の中身がすべて詰まっているんだ」という印象を持った記憶だけは残っている。

 このことを思い出したのは,一昨年開かれた日本図書館情報学会研究大会でのシンポジウムに参加し,パネリストの影浦峡氏(国立情報学研究所)の話を聞いたときである。そのごく一部を,誤解を恐れずに筆者なりに解釈し,主観を交えて抜き書きすれば,「活版印刷の発明によって大量の複製が可能になったのち,図書館員はその中身を知らなくても済むように,本にラベルを付けて管理する方法を編み出した」わけである(注)

 実際,図書館員とは,自館の本を何割程度知っているものなのだろうか。それこそ「知っている」の程度や蔵書の規模にもよるだろうが,例えば,利用者にそのあらましを明確に説明できる本は何冊くらいあるのだろうか。この問いは,単なる疑問であって,これによって「図書館員は本の中身を知っていなければならない」と主張する気は毛頭ない。もちろん,図書館員が読んでおくべき基本的な本というのはあるだろうし,図書館員として読破しておくべき量というのがもしかしたら存在するのかもしれない。しかし,理論的かつ実際的に,ある分野に限定した場合でさえ,それに関連する図書すべての中身を1人の人間がその頭の中に記憶するというのはおそらく不可能であり,分類記号や件名標目のような「ラベル」によって管理せざるを得ないというのは多くの人間が納得するところであろう(さらに本の著者自身が付けた標題もまた一種の「ラベル」である)。

 しかし,それでも,すべての本の中身を知っている「究極の」図書館員を夢見る人はきっといるに違いない。利用者が「○○について知りたいのですが」と尋ねれば,即座に「ああ,それなら,△△という本の124ページに載っていますよ」と答えられる図書館員である。大事な点は,このとき,124ページ目に書かれていることは利用者が求める「知識」であって,図書館員は図書というパッケージ自体ではなく,そこに記された知識を取り扱っている点にある。よって,これはいわば「図書管理」ではなく「知識管理」である。知識を management できる図書館員,パッケージではなく中身で勝負できる図書館員,それこそが「究極の」図書館員の一つの形態であろう。

 いわゆる主題専門家と呼ばれる図書館員の中には,ある程度これを実現している人々がいる。しかし,図書の分野と量を広げて考えた場合には,やはりこれは人間の成せる業ではない。人間がその記憶に費やすことのできる時間には限りがあり,冒頭での筆者の恩師の話は一般的には適用不可能である。

 となれば,知識管理の実現は,どうしてもコンピュータに頼らざるを得ないということになりそうである。ただし,それは「ラベル」に対してのコンピュータ処理ではなく,もちろん「全文」に対する処理でなくてはならない。いくらコンピュータといえども,この要件はかなり高いハードルである。1980年にHarvard Business Reviewに対する全文検索サービスが開始されて以来20年以上が経過しているものの,全文検索が当時の予想に反して思うように伸びない事実を見ても,そのハードルの高さが十分にうかがえる。

 これに対するブレークスルーは,月並みかもしれないが,やはりインターネットの普及と電子文書の増加である。これによってハードルは確実に低くなりつつある。もちろん,コンピュータ自体の目覚しい性能向上も忘れることはできない。筆者はつい最近パソコンを家電販売店で買い入れて自宅に置いている。そのハードディスクに40GB弱の大きさの文献データを入れ,それに対する検索システムを自作してみた。転置索引ファイルを元データから生成し,ある統計的検索モデルに従って結果を返すシステムであるが,かなり長い検索質問文を入力しても,そこそこの応答速度で結果を返してくる。これは,専門業者が大学の機器室に設置した高価なUNIXワークステーションではない。一般の人々が立ち寄る電気屋で買ったパソコンに過ぎない。コンピュータの発展には目を見張るものがある。

 コンピュータの発展はなにもハードウェアに限定されたことではない。知識管理に関連したところでいえば,この実現に役立ちそうな技術の開発が日進月歩で進んでいる。例えば,(1)情報検索,(2)自動要約,(3)情報抽出などがその例である。

 (1)は図書館員にはすでにおなじみの技術であるが,特に1990年代以降の情報検索研究の発展は著しい。米国で立ち上げられた大規模な検索実験プロジェクトであるTREC(Text REtrieval Conference)や,その日本版であるNTCIRプロジェクト(国立情報学研究所)がその発展の契機を提供した。これらの努力によって,情報検索の研究レベルは1990年代以前に比べて飛躍的に向上した。ちなみに,これらのプロジェクトで研究されているのは,現在の司書課程の「情報検索演習」で中心的に教えられているブール型の検索ではなく,統計的モデルと自然言語処理に基づく検索である(NTCIRの詳細は http://research.nii.ac.jp/~ntcadm/index-ja.html を参照)。

 実は,これらのプロジェクトは上記の(2)や(3)にも絡んでいる。(2)の自動要約(automatic summarization)は,図書館情報学流に言えば自動抄録作成であり,長い文献・文書の内容をある一定の長さに圧縮する技術である。一方,(3)の情報抽出(information extraction)とは,利用者がある情報を求めたときに,それが含まれている文献・文書ではなく,その解答を直接そのテキストから抽出する技術である。

 これらの技術を総合したものがおそらくテキストマイニング(text mining)ということになるに違いない。この概念はデータマイニング(data mining)に密接に関連している。データマイニングの有名な事例は,スーパーマーケットでの紙おむつとビールとの関係である。これらは一見何の関係もないように思えるが,店の売上データを統計的に分析した結果,この二つの商品が同時に購入される傾向にあることが判明したそうである。原因は小さな子供を持つ若い父親が両方を買うことにある。そしてこの店は,これらの商品を近くに置くことによって売上を伸ばしたという。これは一種の「知識発見」である。データマイニングの場合,売上記録のようなトランザクションの分析が主対象であるのに対して,テキストマイニングの場合のそれは文書テキストということになる。そして,その際の知識発見のための要素技術が上記(1)〜(3)にほかならない。さらに,この他に自動分類(またはテキスト分類)なども重要である。

 ここでコンピュータ万能主義を唱えるつもりはない。しかし,より高度な知識管理の実現に向けてのヒントが,コンピュータ科学を中心とした研究の成果からぽつりぽつりと出始めたという現状は認識してもよいだろう。そこで中心的な役割を果たすのは,残念ながら図書館情報学ではない。図書館学あるいは図書館情報学は,分類記号や件名標目のようなラベル処理については多くの研究と経験を積み重ね,一つの頂点にまで登り詰めた感がある。しかし,研究対象があくまで「ラベル」なので,知識管理に進もうとしたときに先はなさそうである。また司書課程のカリキュラムに端的に示されているように,図書館学あるいは図書館情報学の教育には,テキストマイニングを下から支えている高度な統計学やコンピュータ関連の科目が含まれていない(少なくとも日本の場合には)。

 現状を鑑みれば,図書の蓄積・検索の重要性は「相対的には」低下していき,今後はWeb文書を含めた電子化された文書の収集・蓄積・検索・管理の必要性が高まっていくことが予想される。これを文書ウェアハウジング(document warehousing)と呼ぶ人々もいる。そこでは,様々な電子文書がインターネットとイントラネットとを駆使して半自動的に収集され,テキストマイニングの技術が直接的に適用可能な形態で文書が蓄積・保存されることになる。このためにはXMLやメタデータのような工夫・技術も大きな役割を果たすであろう。このような傾向が予想どおり進めば(技術志向の予想はよく外れるが),冒頭で述べたような「図書館員が本の中身を知っている」世界ではなく,「コンピュータが電子文書の中身を知っている」世界がやってくるのかもしれない。その過程の中で図書館情報学がどのような貢献を果たせるかについては,一度,真剣に議論をしてみる必要があるだろう。

駿河台大学:岸田 和明(きしだかずあき)

 

(注)シンポジウムの記録は『日本図書館情報学会誌』46巻4号(2001年)に掲載されている。また,勉誠出版から最近刊行された『電子図書館』(2001年)に影浦氏の論文が収録されているので,正確なところはそちらを参照していただきたい。

 


岸田和明 知識の管理と図書館情報学. カレントアウェアネス. 2002, (270), p.5-7.
http://current.ndl.go.jp/ca1455