CA860 – インド国立図書館(カルカッタ)のMARC計画 / 高松みどり

カレントアウェアネス
No.162 1993.02.20


CA860

インド国立図書館(カルカッタ)のMARC計画

もし,ある図書館が,機械可読目録にヒンディー語,ベンガリー語などローマ字以外の文字を使用しなければならないとしたら,どうすれば良いのだろう?

インドは,多言語と多文字の国である。たとえば,1ルピー紙幣には「1ルピー」という表記が15言語で印刷されている。インドの納本図書館である国立図書館(カルカッタ)(NLC)では,UNIMARCを導入することによって,この課題に挑戦している。

インド標準局が1985年にUKMARCに準拠してインドMARCを制定しているのに,NLCがそれを採らずにUNIMARCを採用したのは,国際標準に従うことで書誌データの交換が可能になること,書誌レコード間のリンク付けが行えること,また多言語資料の処理が可能なこと等の理由による。

インドの第7次5ケ年計画(1985〜90)で,NLCはヒューレツト・パッカード社のミニコンHP3000MICRO XEを導入して新しい機械化の時代を迎えた。その後,国際開発研究センター(IDRC,カナダ)によって開発されたリレーショナルDBMSであるMINISISを導入して,目録データベースの開発に着手していたので,これとインターフェイスをとる方式でUNIMARCデータベースを開発している。現在は単行書だけが対象だが,将来は逐次刊行物,視聴覚資料,地図資料をも含める予定である。

インド諸言語資料のコンピュータ処理で問題となるのは,連邦公用語としてのヒンディー語と他の諸言語(ベンガリー語,グジャラーティー語,カンナダ語,タミル語など)の文字がそれぞれ異なっていることである。NLCに納本された図書の60〜70%はインド諸言語資料であり,これら非ローマ字言語の入力,内部処理,画面表示の能力がコンピュータに要求される。

マジュムダール氏は1987年出版の著書で「書誌コントロールの一貫性を保つために,すべてのインド諸言語の記入は(ローマ字では表現できない差異を表記するための)区別的発音符をつけてローマ字に翻字されている。…コンピュータ化された目録作業でインドの図書館員は,区別的発音符の入力の問題に直面するだろう。国立図書館や中央参考図書館(全国書誌担当)で使われている区別的発音符のすべてを機械が受け入れるわけではないからである。」と述べている。

1988年に国立図書館は「区別的発音符と翻字の標準化に関する委員会」を作り,標準的翻字表を作成した。一方,コンピュータによる文字処理に関しては,GIST(Graphic and Intelligence based Script Technology)という技術が開発された。これにより,インド諸言語のコンピュータ処理および言語間の自動翻字も可能になるという。

1991年10月にMINISISにGISTを組み込んで,アッサム語,ベンガリー語,ヒンディー語,テルグー語資料の入力実験が行われた。実用化にはまだいくつかの実験が必要だが,インド諸言語資料の整理をこのシステムで操作できるようになれば,図書館の機械化に新たな時期を画することになるだろう。

高松みどり(たかまつみどり)

Ref: Majumdar, Uma. Implementation of UNIMARC at India's National Library.International Cataloguing & Bibliographic Control 21 (2) 19-24, 1992
Majumdar, Uma. India's National Library. Calcutta, The National Library. 1987. 244p