漢字セット


まず、漢字セットについて説明します。

JIS X 0201

英数記号やいわゆる半角カナが定義されてます。いわゆる半角カナは 「JIS X 0201 カタカナ」と呼ぶべきですが、ここでは半角カナと 呼称します。半角カナは別に 横幅を半分にして表示するように規定されてる文字ではありませんが、 そのように表示する端末が多かったのでそう呼ばれています。 半角カナを使う時は、シフトコードを使って 7bit で表す方法と、 8bit で表す方法があります。半角カナは JIS でも原則として使わな いようにと定められていて、廃止予定でもあります。

英数記号の定義は ASCII コードとほぼ同一です。 ASCII では「〜」「\」が JIS では「 ̄」「¥」となっている為に、 しばしば混乱が起ります。

JIS X 0208

第1水準漢字と第2水準漢字が納められています。工業規格の為か、 あまり遊び心のある字は入っていません。ハートマーク等のトラン プの記号が入ってないのは非常に困ります。これに定められている 英数字や一部の記号は、原則として使わないようにと定められていま す。

1978 年に、国立国語研究所の所長をつとめた林大氏が既成の漢字表を 寄せ集め、事実上一人で作り上げたと言われています。これは JIS X 0208-1978 と言います。旧JIS とも言われ、PC 9801 が採用しました。

1983 年に、林氏の弟子である野村雅昭氏(当時、国立国語研究所日本 語部長)が、事実上1人で実務を担当して改正が行なわれました。 字の追加は良いのですが、字体の変更や文字の移動など、非常に 迷惑な事が行なわれています。何でも 83年制定の JIS X 9052 に合わせて改正したと言います。 何と野村氏は「漢字を使うのを止め、ローマ字を使う事により日本の 民主化を進めよう」等という訳の分からない主張を持つ人との事。 どうやら、漢字体系がめちゃくちゃなのはわざとらしいです。 JIS X 0208-1983 と言います。新JIS とも呼ばれています。

納められている漢字数は全然少なく、高校の教科書も記述できません。

JIS X 0212

1990年に制定されました。補助漢字と呼ばれます。Shit_JIS と共存 出来ない為、余り使用されていなません。

JIS X 0213

2000年に制定されました。 第3水準(2000字)、第4水準(3000字)が納められています。 かねてから念願のハートマークやローマ数字、丸付文字などの 記号類や JIS X 0212 などにあった漢字を含む幾つかの文字が 追加されました。 Shift_JISを使う機種では、機種によっては第4水準が使えないものも 出てきます。

また、機種依存文字と呼ばれている物があります。これを使っている人は特に 98ユーザーや Windowsユーザーに多いです。PC-98x1 や Windows ではローマ 数字や丸で囲った数字が使えます。その様な記号は NEC が独自に定めた文字 で、JIS には定められていません。他の機種でも同じく機種依存文字でローマ 数字や丸で囲った数字が使えても別のコードに割り当てられています。そのた めに 98ユーザーや Windows ユーザー以外は読めない事になります。

悪い事に、Windows の日本語TrueTypeフォントは NEC や 日本IBM が独自に拡 張した NEC拡張文字、IBM拡張文字を取り込んでしまいました。今度からは機 種依存文字ではなく、フォント依存文字、OS依存文字と呼ばれるかも知れませ ん。自分だけが使う場合や、同じ機種間で文章を交換する場合は良いですが、 多機種間で文章を交換する場合や、不特定多数に向けて文章を見せる場合(例 えば NetNews や WWW など)は使ってはいけません。また、JIS 第 3水準、第 4水準が制定されてそれを採用すると、機種依存文字や外字は使えなくなるの で、これを機会に止めた方がでしょう。

ここでは PC-98x1 と Windows の事を取り上げましたが、Macintosh や FMTOWNS にも機種依存文字はあります。例えばハート マークなどです。不特定多数に向けて使ってはいけないのは同様です。


次へ
戻る
(c)1997-2001 村上 智一
Last modified: Fri Jan 5 17:34:56 2001