カレントアウェアネス
No.133 1990.09.20
CA691
日本におけるアジア諸言語のデータベース
近年のコンピュータ技術の発達のおかげで,アルファベットの処理だけでなく,多文字多言語による処理が可能になってきた。アジア各国でもコンピュータによる自国語文章の処理の研究が行われ始めており,自国語によるデータベース作成の機運が生まれている。
文字処理については,日本はもちろん,韓国ではハングル文字の処理が,中国では簡化文字による機械処理が行われている。アラビア語,インド語,タイ語等は文字フォントの開発が進められている。しかし,アジア諸語を用いてのデータベース作成を行っている例は少なく,限られた研究分野や個人で行われているにすぎない。データベースの作成とその国際的流通については,その基礎となる文字フォント作成の段階で,例えば次のような標準化の障害があり,作成の促進は容易ではない。
- 国際性に乏しく地域的な特殊言語,特殊文字が多く存在している。
- 一つの国の中に多くの民族,言語,文字が複雑に混在しており統一が難しい。
日本におけるアジア諸語の研究は限られた機関で行われている。文字フォントの作成とそれを使用してのアジア情報の処理をする機関はさらに限られてくる。そのような機関でも,文字フォントやデータベースの作成と使用は限られており,全国レベルのものはない。
現在アジア諸言語の使用を必要とする機関とデータベース作成の状況をまとめてみると,表のようになる。
機関名 | 文字フォント | 作成データベース |
国立民族学博物館 | 中国文字 (13,000文字) その他の文字は現在開発中 | 中日大辞典のデータベース |
国立歴史民俗博物館 | 必要性有り | |
東京大学東洋文化研究所 | 必要性有り | 学術情報センターを使用 |
東京外国語大学アジア・アフリカ言語文化研究所 | 中国文字 ハングル文字 モンゴル語 ベトナム語 タイ語 ビルマ語 カンボジャ語 ヒンディー語 ベンガル語 サンスクリット ウルドゥー語 アラビア語 ヘブライ語 スワヒリ語 ハウサ語 その他 | 言語辞書データベース |
京都大学東南アジア研究センター | 必要性有り | |
亜細亜大学アジア研究所 | 必要性有り | |
慶応義塾大学言語文化研究所 | 必要性有り べトナム語 | 中古越南語の語彙論と文字論についてのデータベース |
国際キリスト教大学アジア文化研究所 | 必要性有り | |
上智大学アジア文化研究所 | 必要性有り | |
成蹊大学アジア太平洋研究センター | 必要性有り | |
学術情報センター | 必要性有り | 東アジア文字研究会にて研究中 |
東京大学 | インド語 | インド学仏教学論文データベースの作成,検索,表示システム |
東北大学 | サンスクリット | サンスクリット法華経写本の語彙検索 サンスクリット文献の自動解読 サンスクリット法華経に表れる各種字体の比較検討 |
東京外国語大学 | インド語 | 文字列置換について インド系文字で表現される言語資料のコンピュータ処理 |
種智院大学 | パーリ語 | パーリ語テキストのコンピュータ可読化について |
東北工業大学 | チベット語 | データベース蓄積による木版刷りチベット文字自動認識 |
林 典門