CA1965 – 新元号と文字コードの国際標準を巡って / 小林龍生

PDFファイル

カレントアウェアネス
No.342 2019年12月20日

 

CA1965

 

新元号と文字コードの国際標準を巡って

一般社団法人文字情報技術促進協議会:小林龍生(こばやしたつお)

 

 2019年は、平成最後の年として始まり、令和元年として暮れようとしている。本論では、新天皇即位に伴う平成から令和への改元に係わる国際符号化文字集合UCS(ISO/IEC 10646:Universal Coded Character Set)(1)とUCSに対応する民間標準規格ユニコード(Unicode Standard)(2)を巡る2つの話題について論じる。

 

1. 令和の合字について

 活版で印刷された新聞や書籍を見ると、しばしば、1字分のスペースに、複数の文字を鋳込んだ活字を目にすることがある。いわゆる合字と呼ばれるもので、リガチャーとも呼ばれる。

 ただし、欧文のリガチャーは、羊皮紙本の写本などで用いられていた複数のアルファベットの簡略筆写法の残滓としての意味合いが強いが、日本語活字の合字は、どちらかというと、省スペースのため、という意味合いが強いようである。

 UCSには、日本の活字に由来する合字がいくつか符号位置を得ている。アンペアやメートルなどの単位を表すものが多いが、明治、大正、昭和、平成といった明治維新以降の元号も含まれている。

 これらの元号の合字は、初期の情報システムにとっても使い勝手が良かったようで、扱える文字数の限られていたディスプレーやデータベースシステムに格納するデータのうち、年月日を表示したり入力したりするために多用されていた。日本最初の漢字コードのJIS規格であるJIS X 0208には含まれていなかったにもかかわらず、いわゆるメインフレームやパーソナルコンピューターには、それぞれのメーカー独自の方式で多く実装され用いられていた。そのような市場実態を反映してか、UCSにも最初の段階から符号位置を得ている。

 2016年に天皇の生前退位が話題になり始めたころから、UCSに対応する国際標準化活動を行っている情報処理学会情報規格調査会SC2専門委員会(以下「JSC2」)でも、新元号の合字をどのように扱うかについての話題が持ち上がるようになっていた。

 当初は、合字のメカニズムそのものが、過去の規格や実装との後方互換性を目的としたもので、規格論的にも実装技術的にも、現時点においては必ずしも必須のものではない(合字の国際符号化を行わなくても技術的には対処可能である)という観点から、新規規格化について消極的な意見が主流だった。しかし、JSC2に委員を出しているIT企業による市場調査の結果、現在稼働している行政システム、民間システムの中には、先に触れたような明治・大正・昭和・平成の元号に対応する合字の符号位置やフォントの視覚表現に強く依存する(アーキテクチャとしては過去のものとなっている)システムがいまだに多く残っていることが明らかになってきた。新元号を国際符号化文字集合に取り込まなければ、システム全体を最新のアーキテクチャに変更しなければならず、システム更改のコストが莫大な金額に上ることも判明した。

 基本OSやシステムインテグレーションに係わるJSC2メンバーからの要請を受けて、2017年11月のSC2専門委員会で、新元号に対応する合字の国際標準化を促す方向での合意が成立し、国際的な働きかけが始まった。しかし、その時点では、新元号がどのようなものになるかについては、いわば影も形もない状況だった。

 一方、符号化文字集合というものは、本質的には、文字の名前とビット列(UCSでは16ビットもしくは31ビット)の排他的な対応関係の集合に尽きる。そのため、まだ決まってもいない元号を符号化文字集合の中で標準化することは原理的に不可能なことだった。

 そこで、JSC2は、いわば裏技とでもいうべき戦略をとることとした。すなわち、UCSの開発を担当しているISO/IEC JTC1/SC2(以下「SC2」)とユニコード技術委員会(以下「UTC」)の議長に対して、「日本の新元号がまもなく決まるが、その符号位置だけを予約し、公表してもらえないだろうか」という依頼のメールを出すこととした。

 幸いなことに、これらのメールは、非常に好意的に受け止められた。

 SC2においても、UTCにおいても、まさに可及的速やかに符号位置U+32FFを日本の新元号のために予約するという決議がなされ、その決議録や議事録が、世界中に公表された。

 この決議録や議事録だけを拠り所として、日本のみならず、世界中の情報通信機器やシステムの新元号対応準備が始動した。

 新元号「令和」は、新天皇即位に先立つ2019年4月1日に発表された。わずか1か月の準備期間にもかかわらず、5月1日の改元に際しては、さしたる大きな混乱もなく、無事に令和の時代を迎えることができた背後には、国際的な標準化コミュニティの大きな協力があった。そして、早くも5月7日、ユニコードコンソーシアムは、「令和」の合字を含むUnicode Standard Ver.12.1を公開した(3)

 

2. 令の字体について

 新元号発表を受け、経済産業省は、いち早く4月5日付けで、「新元号名で使用する文字コードについて(周知)」(4)(以下「周知」)と題する文書を公表している。

 この文書には、「令」に対応するUCSの符号位置としてU+4EE4が、「和」に対応する符号位置としてU+548C、そして、その合字としての「令和」に対応する符号位置として、先に挙げたようにU+32FFを含むブロックが明記されている。

 行政府の中でIT関連産業をつかさどる経済産業省が、いち早くこのような文書を公表したことは、情報通信分野における新元号対応の混乱を事前に抑止するという意味で、非常に意義深いことに思われる。以下、符号化文字集合における「字体」概念を軸に、この文書の意義について論じる。

 

 U+4EE4とU+548Cに対応するUCSの規格票は、図1・図2のようになっている。

 

図1:U+4EE4の規格票
※Unicode Version 12.1.0の規格票(5)から抜粋

 

 

図2:U+548Cの規格票
※Unicode Version 12.1.0の規格票(6)から抜粋

 

 UCSの統合漢字では、それぞれの国や地域から提案された文字を、一定の規則に基づいて統合し、共通の符号位置を付与している。この符号表からは、「U+4EE4に相当するのは、「令」という漢字だが、その書き方は国や地域によりいろいろな形があり、UCSとしてはそれらを統合してU+4EE4という共通の符号位置を付与している」ということが読み取れる。「和」については、細かなデザイン差があるとはいえ、議論になりそうな問題はなさそうである。

 一方、日本の文字に関する規範的文書という点では、文化審議会の議論を基に内閣が告示する常用漢字表(7)も欠かすことができない。当然ながら、「令」も「和」も、文字種としては常用漢字表に含まれているが、「令」については、特に、「(付)字体についての解説 第2 明朝体と筆写の楷書との関係について 2筆写の楷書では,いろいろな書き方があるもの (6)その他」として、図3のような記載がある。

 

図3:常用漢字表における「令」のデザイン差
※常用漢字表(8)から抜粋

 

 UCSの規格票(図1)と常用漢字表の例図(図3)を見比べてみると、UCSの規格票の左の3個の字の形が、常用漢字表の筆写の楷書体(右側)と類似している。実際、一般の社会生活においては、手書きの際は、図4の形を用いることが多いだろう。

 

図4:手書きの際の「令」のデザイン例①
(図3の右側)

 

 

図5:手書きの際の「令」のデザイン例②
(図3の左側)

 

 さらに、図6は、菅義偉内閣官房長官の記者発表の折の写真である。

 

図6:内閣官房長官の記者発表時に使用された「令和」のデザイン
※首相官邸ウェブサイト(9)掲載の写真をもとに筆者が抜粋して作成

 

 常用漢字表の例図(図3)の二つの手書き字形と微妙に異なっている。

 うがった見方ではあるが、ここに示された令の形も、存外、熟慮を重ねた上で決められたものではないかとも思われる。

 この記者発表の形が、図4であったり図5であったりした場合、内閣府が発表したのだから、図4の形を用いなければならない、いや、図5の形が正しい、といった些末な議論が巻き起こることは必定だったであろう。

 経産省が「周知」を出した背景には、これらの字の形を巡る混乱を未然に防ぐ、という意図があったのではないかと推測される。

 さて、ここまで、あえて字の形というあいまいな表現を遣ってきたが、この議論の背景には、「字体」概念と「字形」概念の相違についての問題が横たわっている。

 「字体」と「字形」の概念上の区別については、文字コードの関係者や日本語学の専門家の間では常識となっているが、一般の人々にはあまり理解されていないようである。また、この「字体」と「字形」の概念上の区別について、文化審議会国語部会の答申類や符号化文字集合標準における考え方とは異なる理解を持った人たちが散見される。

 これらの概念の相違については、以前論じたことがあり(10)、また、文化庁が公表している「常用漢字表の字体・字形に関する指針」(11)にも、優れた解説があるので、ご参照いただきたい。

 ここでは、

 字体とは、文字の骨格を表す抽象概念

 字形とは、個別具体的な文字の視覚表現といった程度のものと、理解しておいていただきたい。

 先のUCSの規格票における「和」の例は、字形としては微細な差があるが、字体としては同一、ということであり、「令」の例は、字体は国や地域によって異なるが、同一の符号位置に統合されている、ということになる。

 常用漢字表の例は、明朝体活字の字体と手書き楷書体の字体は、異なる場合があり、場合によっては、手書き楷書体でも、複数の字体が並立する場合がある、ということになろうか。

 当然ながら、複数の字形の集まりの、どこに、字体としての異なりの線を引くかは、それこそ、十人の論者がいたら、百通りの線が引ける、という状況を呈する。先の、官房長官による記者発表の揮毫を例とすると、この形を「令」(図5)という字体の微細な字形差と捉えるか、新たな独立した字体と捉えるか、ということになる。

 経済産業省の「周知」は、UCSの例示字形に示されたような字の形の差(字体差または字形差)に拘泥する必要はない、ということを、新元号の発表から時を経ずに明確に示したものと言えよう。

 

3. 国際標準と日本の言語・文化

 本論では「令和」と国際標準を巡る2つの話題を取り上げた。この2つの話題の背後には、技術の発達による地球上の情報通信環境の平準化という大きな動きの中で、個々の言語文化をどう保持継承していくかというやっかいな問題が横たわっている。現在、元号に類する年代表記が日常的な社会生活の中で用いられているのは日本だけだと仄聞したことがある。たった一つの符号位置のこととはいえ、日本からの要請に対して、SC2やUTCがとった迅速かつ好意的な対応は、筆者にはいささか意外な喜びだった。また、経済産業省の「周知」公表も、日常生活に係わる情報通信システムにとって国際標準との整合性が非常に大切だということについての理解が、行政の現場においても浸透していることの証左として、これも意外な喜びだった。

 情報通信環境の新元号への対応は、日本においても国際標準との整合性が不可欠であることを思い返させてくれた。しかし、情報通信環境の平準化の中で、それぞれの言語文化を保持継承していかなければならないのは日本だけではない、ということも忘れてはならない。「令和」への一連の対応を知ることが、多様な言語文化への想像力を拡げる小さなよすがとなれば幸甚である。

 

(1) ISO/IEC 10646:2017. Information technology –Universal Coded Character Set (UCS).
http://standards.iso.org/ittf/PubliclyAvailableStandards/c069119_ISO_IEC_10646_2017.zip, (accessed 2019-11-07).

(2) “About the Unicode® Standard”. The Unicode Standard.
http://www.unicode.org/standard/standard.html, (accessed 2019-11-07).

(3) 以上の経緯についての詳細は、
小林龍生. 新元号の国際標準化秘話. 標準化と品質管理. 2019, 72(8), p. 24-28.
をご参照いただきたい。

(4) “新元号名で使用する文字コードについて(周知)”. 経済産業省.2019-04-05.
https://www.meti.go.jp/policy/it_policy/kaigen/20190405_kaigen_code.pdf, (参照 2019-10-23).

(5) “CJK Unified Ideographs”. Unicode 12.1 Character Code Charts.
http://www.unicode.org/charts/PDF/U4E00.pdf, (accessed 2019-11-07).

(6) Ibid.

(7) “常用漢字表(平成22年11月30日内閣告示)”. 文化庁. 2010-11-30.
http://www.bunka.go.jp/kokugo_nihongo/sisaku/joho/joho/kijun/naikaku/pdf/joyokanjihyo_20101130.pdf, (参照 2019-10-23).

(8) 前掲.

(9) “新元号の選定について”. 首相官邸. 2019-05-23.
https://www.kantei.go.jp/jp/headline/singengou/singengou_sentei.html, (参照 2019-11-07).

(10) 小林龍生.字体と字形の狭間で 文字情報基盤整備事業を例として.情報管理. 2015, 58(3), p. 176-184.
https://doi.org/10.1241/johokanri.58.176, (参照 2019-10-23).

(11) “常用漢字表の字体・字形に関する指針(報告)について”. 文化庁. 2016-02-29.
http://www.bunka.go.jp/koho_hodo_oshirase/hodohappyo/pdf/2016022902.pdf, (参照 2019-10-23).

 

[受理:2019-11-18]

 


小林龍生. 新元号と文字コードの国際標準を巡って. カレントアウェアネス. 2019, (342), CA1965, p. 9-11.
https://current.ndl.go.jp/ca1965
DOI:
https://doi.org/10.11501/11423547

Kobayashi Tatsuo
New Japanese Era Name “REIWA” and International Standard