CA1067 – 挑戦?むしろ好機である−中国における情報検索の情況− / 嶋田真智恵

カレントアウェアネス
No.201 1996.05.20


CA1067

挑戦?むしろ好機である
−中国における情報検索の情況−

中国は現在,情報検索(IR=Information Retrieval)の進歩にむけて,日々邁進しているように思われる。「中国での社会的流れは,IRの進歩・普及を促進する方向になっている」(Minzu, et al., p. 66)と述べられる様に中国では積極的にIRの開発を進めていこうという意気込みが感じられる。

特に,第8次5カ年計画期間中(1990−1995年)でのデータベースの普及が目覚ましかった。例えば,中国科学技術情報研究所(ISTIC=The Institute of Scientific and Technical Information of China)の文献加工部では,データベース開発と検索言語,検索理論の研究などを行っているが,そこで作成されたものには,中国文献のタイトルインデックスデータベースや,中国企業情報のデータベースがある。また中国は,これからのデータベース振興の方策として,データベースの商用化,データベース作成チームの再編,ビジネスデータベースの開発,中国文献の総合的なデータベースの構築などに取り組む,と1995年の「中国語文献データベース国際セミナー」で述べている。

それでは,IR分野の中国の近年の動きにはどのようなものがあるのだろうか。前出のISTIC等が開発した中国語仕様のIRソフトは香港や台湾,シンガポールでも使われているという。しかし開発の現場では,まだこれからといった問題が幾つも残されている。第1に,中国のIRは単純な文字列検索の段階で,確率や自然言語処理の手法を応用したシステムの開発はなされていない。第2に,現在の中国の大部分のIRは閉鎖的であり,少数のデータベースを検索するサービスが限られた組織内のユーザーに提供されているだけである。オンラインのネットワークは通信網の未整備や,旧式のコンピュータのせいで遅れている。そしてオンラインのIRシステムは実験段階のものがいくつかあるにせよ,外部に開かれているネットワーク化されたIRシステムは存在しない。第3に,科学技術情報分野では,書誌情報を提供するIRシステムが主であり,数値データやファクトデータを提供するシステムこそ増加しているものの,画像や音声を扱うシステムは今のところ中国にはない。第4に,現在メインフレーム型のIRシステムでは,統制語しか検索できない。従って検索できる項目は極めて少なく,またシソーラス(用語解説T11参照)に大きく依存することになる。転置ファイル(inverted index files)をバッチ処理により更新しているため,運用に融通性が欠ける結果となっている。第5に,情報サービス機関の多くは,各々の持つメインフレームを対象にして,独自のIRシステムを,それぞれ異なったプログラミング言語で書くため,ソフトの共用ができない。またそのプログラミング言語は旧式で,開発やメンテナンスにお金と時間がかかってしまう。そして,ユーザインターフェースや,コマンド言語,データフォーマットを標準化しなかった結果,IRソフトは互換性に欠けるものとなってしまっている。

中国がまだIR分野において開発途上であることを認めた上で,発展には以下の要因が係わってくると論文はのべている。それは,技術レベル,情報ニーズ,図書館および情報サービス機関の基盤整備,社会的文化的な潮流,中国文字の処理である。

そして,第9次5カ年計画(1996−2000年)における優先事項がいくつか挙げられている。

1. 書誌事項のサービスから全文への移行。中国文字の全文検索の研究を進める。2. IRシステムを,これまで主流であったホスト型からクライアント/サーバ型のシステムに移行していく。国内外のデータにアクセスするためには,IRのネットワークを必要とする。3. ユーザインターフェイスについていえば,コマンド方式とメニュー方式の併用が求められる。GUI(用語解説T12参照)が薦められる。4. 電子出版やマルチメディアデータベースのIR研究が重要になる。5. 新規にクライアント/サーバ型のIRソフトのデザインをする際には,中国文献の全文検索の能力をORACLEやSYBASEといったデータベース管理システムに応用していく必要があろう。

中国のIR研究に対する姿勢を見ると,孤立化を避け,海外のIRの発展と歩みを共にしたいという考えが窺える。現在,世界的なネットワークの広がりは勢いを増しつつある。中国においても次期5カ年計画で,国をあげて情報化に取り組むつもりであることが分かる。そして中国はこの取り組みを,挑戦というより,世界的に情報網が普及する今日にあって,むしろ好機ととらえているようである。

嶋田 真智恵(しまだまちえ)

Ref: Minzu, Zeng et al. Challenges and opportunities for information retrieval in China. Asian Libraries 4(2) 63-71, 1995
川野惟二 中国科学技術情報研究所 情報の科学と技術 39(8) 312-315, 1989
曹周華 呉家柱 我国数據庫産業発展対策研究高校文献信息学刊 第3−4期1‐10,1994