外字
外字の最新ニュースをまとめて検索!
外字(がいじ)とは、特定の文字集合(文字コードなど)に含まれない文字のことをいう。日本で一般には、JIS規格の文字コード(通常はJIS X 0208、稀にJIS X 0213やJIS X 0221)に含まれない文字のことをさし、「表外字」とも呼ばれる。常用漢字に含まれない文字のことを外字ということもある。
目次 |
[編集] 文字コードにおける外字
[編集] 日本語1バイト文字集合における外字
PC98シリーズなどでは、JIS X 0201の文字以外に記号などが個別に定義されていた。これらは98文字などと呼ばれ、外字の一種である。
[編集] JIS X 0208における外字
1979年にJIS X 0208に含まれない文字を使用するために、未定義領域と呼ばれるエリアに独自の文字を作成する手段がとられていた。
メーカなどがシステムにあらかじめ組み込んでいた外字をシステム外字やベンダ定義文字と呼び、個々のユーザが作成した外字はユーザ外字やユーザ定義文字と呼ぶ。
ワードプロセッサなどでも、外字の作成が可能な製品も多数存在した。Microsoft Windowsの場合は、標準で附属する外字エディタというアプリケーションでユーザ外字が作成可能である。
一般にはShift_JISにおける0xF000〜0xFFFCの領域がユーザ外字領域として広く用いられてきた。
このユーザ外字領域にあらかじめ各種の文字を入れておいたフォントなどもあり、外字領域の文字しか含まれないフォントのことを外字フォントと呼ぶ。
JIS X 0208の1997年における改訂でこの未定義領域に外字を入れることが原則禁止された。
[編集] JIS X 0213における外字
2000年に規格化されたJIS X 0213では、Shift_JIS-2004(Shift_JISX0213)というShift_JISの符号化表現を拡張した規格が定義された。この文字コードでは、実装水準3(第3水準の文字までしか含まない)で実装する場合には、0xF000〜0xFFFCの領域を外字領域として使用してよいこととした。
[編集] JIS X 0221 (Unicode)における外字
Unicodeでは、外字エリアとして私用領域という名称でU+E000〜U+F8FF、U+000F0000〜U+000FFFFD、U+00100000〜U+0010FFFDに外字領域を設けてある。
Windowsのユーザ外字領域であるShift_JISの0xF040〜0xF9FCはUnicodeのU+E000〜U+E757に順番に対応付けられている。(Shift_JISで0xF07Fなどの使用不可能なコードポイントは飛ばす。)
Windows付属の外字エディタではU+E758〜U+F8FFにも外字を作成可能であるが、そこに作成したものはUnicode環境でのみ使用可能となる。
WingdingsなどのシンボルフォントのグリフはUnicodeではU+F020〜U+F0FFの一部に対応付けられている。
ARIB外字や携帯電話の絵文字などこれまでは外字でしか使用できなかった文字についても、順次Unicodeに含めることが進められている。
[編集] DRCS外字
日本のデータ放送、文字放送、字幕放送などではDRCS外字という外字が使用可能である。ARIBの文字コードではJIS X 0208の文字やARIB外字などを使用できるが、これ以外に任意の外字が自由に使用可能である。ARIBの規格で任意の外字を送信する仕組みが仕様として規定されており、この仕様をすべての受信機がサポートしていることが保障されているため、自由な外字を使用することが可能となっている。
[編集] 問題点
外字はその文字コード情報のみでは、あらかじめどのコードにどの文字を入れているかを同期させている場合と、上記DRCS外字を使用する場合を除き、別の環境とのデータのやり取りができない。
[編集] 外字登録
ワープロ専用機やワープロソフト、Windows などのオペレーティングシステムでは、ユーザが自分で外字を登録できるようになっている。
[編集] 常用漢字表外字
常用漢字表に含まれない文字のことを表外字と呼ぶ。平成12年に表外漢字字体表を国語審議会が発表し、常用漢字に含まれない漢字の字形のよりどころを規定した。
[編集] その他
- 人名の苗字などで使用される漢字などを集めた外字を、人名外字と呼ぶ。
人名漢字の多くは、人の手書きによる書き癖により外字とされる場合が多い。

