Big5

Big5の最新ニュースをまとめて検索!

Big5(ビッグファイブ、中国語名:大五碼あるいは五大碼)は、台湾香港マカオといった繁体字中国語圏で最も一般的に使われている文字コード文字集合)。

目次

[編集] 特徴

1984年5月1日に台湾の資訊工業策進会(Institute for Information Industry)が制定したもので、「電腦用中文字型與字碼對照表」として発行したものである。5大パソコンメーカーであったエイサー(宏碁)、マイタック(神通)、佳佳、ゼロワン(零壱)、FIC(大衆)が共同で策定したことによりこの名がある。

ローマ字アラビア数字蘇州号碼記号類、注音符号のほか、漢字1万3062字を収録するが、そのうち2字は重複しているため、実際の漢字の文字集合は1万3060字である[1]台湾香港マカオなどの繁体字地域で普及しているが、2003年にCNS 11643の附属書で追認されるまでは公的規格ではなかった。WindowsMac OSといったオペレーティングシステムで採用されたことにより定着したデファクトスタンダードである。

2バイトで約13000字を収容し、第一バイトは0xA1~0xC6および0xC9~0xF9、第二バイトは0x40~0x7Eおよび0xA1~0xFEの範囲をとる。大きく分けて、非漢字、常用漢字、次常用漢字の3つのブロックで構成され、漢字は総画数順、次いで部首順に配列されている。これはJIS X 0208GB 2312の第2水準の「部首・画数順」とは逆になる。なお一部、重複している漢字や、配列の誤りがある。

符号空間がシフトJISと似ており、第二バイトに0x5Cが含まれるため、シフトJISの抱える円記号問題と同様の問題をも抱えている。ただし、シフトJISはJIS X 0208文字集合の符号化方式の一つであるのに対して、Big5は文字集合と符号化方式が一体化しており、通常これ以外の符号化方式で利用されない点が大きく異なる。

[編集] 拡張

Big5に対しては、これまでさまざまな拡張が行われている。代表的なものについて以下に挙げる。

[編集] 独自拡張

独自拡張としては、Windows 95以前に最も普及していた中国語システムである倚天 (Eten) のものが古くから知られている。「碁、銹、恒、裏、墻、粧、嫺」の7字(倚天拡張字)のほか、罫線素片キリル文字丸数字などが採用されている。また倚天の拡張には仮名が含まれ、Big5ベースのシステムで日本語を表現する方法としてさかんに用いられた。この拡張は、時に「Big5-Eten」とも呼ばれ、独自拡張としては最も重要なものの一つといえる。

Microsoft Windowsで使われている繁体字文字集合である「コードページ950」は、オリジナルのBig5に、7文字の倚天拡張字と罫線素片を取り入れたものである。Windows MEからは、「ユーロ記号)」が追加された。

[編集] 台湾の公的拡張

Big5+
中文數位化技術推廣基金會(Chinese Foundation For Digitization Technology, CMEX, 中推会)が「BIG-5碼字集擴編計畫」により1997年7月に策定したもので、ISO/IEC 10646:1993 (Unicode 1.1) の漢字をすべて取り入れたもの。追加部分は、一般の文書で常用される「標準字集」の4670字と、「推薦字集」の3250字からなる。この文字コードセットは、従来のBig5のコードの範囲を超えていることから、Windowsなどのパーソナルコンピュータ・オペレーティングシステムで使用することができず、ほとんど普及しなかった。Unicodeの漢字をすべて取り込んだことと、文字符号化の手法の2点において中国GBKによく似ている。
Big-5E
「BIG-5碼補充字集 (BIG-5 Extension Character Set)」の略称。Big5の外字エリアに収まるようにBig5+の「標準字集」から政府機関で常用される3954字を選び出したもの。

[編集] 香港の公的拡張

香港増補字符集
香港では、Big5に収録されなかった広東語方言字、固有名詞や科学技術に用いる漢字、仮名、漢字の部品などを外字として補充することが行われた。政府による外字集を基にした香港増補字符集と称する文字集合が策定され、普及している。

[編集] 脚注

  1. ^ 漢字領域以外に度量衡記号の領域0xA259-0xA261に「兙兛兞兝兡兣嗧瓩糎」の9文字がある。重複字は「兀」(0xC94A)と「」(0xDDFC)。

[編集] 参考資料

[編集] 関連項目


最終更新 2009年9月15日 (火) 06:50 (日時は個人設定で未設定ならばUTC)。
【Big5】変更履歴

ご利用上の注意

もっと調べる!