ASCII

ASCIIの最新ニュースをまとめて検索!

この項目には、一部のコンピュータや一部の閲覧ソフトで表示できない文字が含まれています(詳細)。
US ASCII コードチャート早見表

American Standard Code for Information Interchangeは、現代英語や西ヨーロッパ言語で使われるラテン文字を中心とした文字コード。略称はASCII(アスキー)。これはコンピュータその他の通信機器において最もよく使われているものである。

目次

[編集] 概要

ASCIIは、7桁の2進数で表すことのできる整数の数値のそれぞれに、大小のラテン文字数字、英文でよく使われる約物などを割り当てた文字コードである。1963年6月17日に、American Standards Association(ASA、後の ANSI)によって制定された。当時の規格番号は ASA X3.4 、現在の規格番号は ANSI INCITS 4 である。

ASCIIはISO標準7ビット文字コードISO/IEC 646の元となり、後に8ビット文字コードであるISO/IEC 8859が主流となって以降、世界中で使用されている様々な文字の符号化方式の多くは、ASCIIで使用されていない128番以降の部分に、その他の文字を割り当てたものである。

他の文字コードと同じく、ASCIIは整数で表されるデジタルデータと文字集合とが対応づけられたコードである。このコードに従い、文字等を整数に変換する事で、通信、文字情報の処理や保存を行うのが容易になる。ASCIIやASCII互換コードは、ほとんど全てのコンピュータ(特にパーソナルコンピュータワークステーション)で扱う事が出来る。MIMEでは、"US-ASCII"とするのが望ましい。

ASCIIは7ビットコードである。つまり、情報を表すのに7桁の2進数(10進数では0〜127)を用いる。ASCIIが規格化された頃ですら、ほとんどのコンピュータの扱う最少単位のバイトは8ビットであるオクテットであった。そのため8ビット目は通信におけるエラーチェック用のパリティビットとして用いられていた。21世紀初頭においても、互換性を維持する目的で、7ビットコードが正式で、8ビット目は使用できない規格がいくつか存在する。

ASCIIはテキストの構造や見た目に関する情報は持たない。そのような情報はマークアップ言語などを使用する事で補うことが出来る。

ASCIIの構成は次のようになっている。

コード範囲(16進) 内容
0x00-0x1f 制御文字
0x20 空白
0x21-0x7e 図形文字
0x7f 制御文字(DEL)

[編集] ASCII制御文字

初めの32文字(10進数で0-31)はASCIIでは制御文字として予約されている。基本的にはこれらの制御文字は表示するための文字ではなく、モニタプリンタなどの機器を制御するために用いられる。例えば、ASCII 10(10進)はline feed(改行)を表し(プリンタの紙送りなどに用いる)、ASCII 27はエスケープを表す。

ASCII 127(全てのビットがON、つまり、2進数で1111111)は、deleteとして知られる制御文字である。この記号が現れた場合、その部分のデータが消去されていることを示す。この制御文字だけ先頭部分になく最後にある理由は、パンチテープへの記録は上書きが出来ないため、削除する際には全てに穴を空けることで対応できるというところからきている(1111111は全てに穴の開いた状態を示す)。また、ASCII 0(全てのビットがOFF、つまり2進数で0000000)はヌルあるいは空文字と呼ばれ、deleteと同様に多くのコンピュータシステムでは無視される。これは、仮にパンチテープと反対に1を0に変えることでデータを記録し、かつ上書きが不可能な媒体が存在する場合でも対応できるようにしているのである。

コードの多くは、データ転送プロトコルで用いられる。(例:ヘッディング開始、テキスト開始、テキスト終了など。)

セパレータは磁気テープへの保存のために設計された。

XON や XOFF は、プリンタのような処理の遅いデバイスにおいて、データを失うことがないように情報の流れを制御するために用いる事がある。

2進 10進 16進 略語 図形表現 Ctrl+ 名前/意味
000 0000 0 00 NUL @ 空文字
000 0001 1 01 SOH A ヘッディング開始
000 0010 2 02 STX B テキスト開始
000 0011 3 03 ETX C テキスト終了
000 0100 4 04 EOT D 伝送終了
000 0101 5 05 ENQ E 問合せ
000 0110 6 06 ACK F 肯定応答
000 0111 7 07 BEL G ベル
000 1000 8 08 BS H 後退
000 1001 9 09 HT I 文字タブ
000 1010 10 0A LF J 改行
000 1011 11 0B VT K 行タブ
000 1100 12 0C FF L 書式送り
000 1101 13 0D CR M 復帰
000 1110 14 0E SO N シフトアウト
000 1111 15 0F SI O シフトイン
001 0000 16 10 DLE P 伝送制御拡張
001 0001 17 11 DC1 Q 装置制御1,XON
001 0010 18 12 DC2 R 装置制御2
001 0011 19 13 DC3 S 装置制御3,XOFF
001 0100 20 14 DC4 T 装置制御4
001 0101 21 15 NAK U 否定応答
001 0110 22 16 SYN V 同期信号
001 0111 23 17 ETB W 伝送ブロック終結
001 1000 24 18 CAN X 取消
001 1001 25 19 EM Y 媒体終端
001 1010 26 1A SUB Z 置換
001 1011 27 1B ESC [ エスケープ
001 1100 28 1C FS \ ファイル分離標識
001 1101 29 1D GS ] グループ分離標識
001 1110 30 1E RS ^ レコード分離標識
001 1111 31 1F US _ ユニット分離標識
111 1111 127 7F DEL 抹消

[編集] ASCII印字可能文字

ASCII 32は、空白文字である。キーボードのスペースキーから入力でき言葉の間に空白を表示する。 ASCII 33~126は印刷可能な文字(printable characters)であり、半角英数の数字、句読点や記号を表す。

2進 10進 16進 文字
010 0000 32 20 間隔 (␠)
010 0001 33 21 !
010 0010 34 22 "
010 0011 35 23 #
010 0100 36 24 $
010 0101 37 25 %
010 0110 38 26 &
010 0111 39 27 '
010 1000 40 28 (
010 1001 41 29 )
010 1010 42 2A *
010 1011 43 2B +
010 1100 44 2C ,
010 1101 45 2D -
010 1110 46 2E .
010 1111 47 2F /
011 0000 48 30 0
011 0001 49 31 1
011 0010 50 32 2
011 0011 51 33 3
011 0100 52 34 4
011 0101 53 35 5
011 0110 54 36 6
011 0111 55 37 7
011 1000 56 38 8
011 1001 57 39 9
011 1010 58 3A :
011 1011 59 3B ;
011 1100 60 3C <
011 1101 61 3D =
011 1110 62 3E >
011 1111 63 3F ?
 
2進 10進 16進 文字
100 0000 64 40 @
100 0001 65 41 A
100 0010 66 42 B
100 0011 67 43 C
100 0100 68 44 D
100 0101 69 45 E
100 0110 70 46 F
100 0111 71 47 G
100 1000 72 48 H
100 1001 73 49 I
100 1010 74 4A J
100 1011 75 4B K
100 1100 76 4C L
100 1101 77 4D M
100 1110 78 4E N
100 1111 79 4F O
101 0000 80 50 P
101 0001 81 51 Q
101 0010 82 52 R
101 0011 83 53 S
101 0100 84 54 T
101 0101 85 55 U
101 0110 86 56 V
101 0111 87 57 W
101 1000 88 58 X
101 1001 89 59 Y
101 1010 90 5A Z
101 1011 91 5B [
101 1100 92 5C \
101 1101 93 5D ]
101 1110 94 5E ^
101 1111 95 5F _
 
2進 10進 16進 文字
110 0000 96 60 `
110 0001 97 61 a
110 0010 98 62 b
110 0011 99 63 c
110 0100 100 64 d
110 0101 101 65 e
110 0110 102 66 f
110 0111 103 67 g
110 1000 104 68 h
110 1001 105 69 i
110 1010 106 6A j
110 1011 107 6B k
110 1100 108 6C l
110 1101 109 6D m
110 1110 110 6E n
110 1111 111 6F o
111 0000 112 70 p
111 0001 113 71 q
111 0010 114 72 r
111 0011 115 73 s
111 0100 116 74 t
111 0101 117 75 u
111 0110 118 76 v
111 0111 119 77 w
111 1000 120 78 x
111 1001 121 79 y
111 1010 122 7A z
111 1011 123 7B {
111 1100 124 7C |
111 1101 125 7D }
111 1110 126 7E ~
備考
大文字のASCII値に32を加えると小文字に変換することが出来る。この変換は、2進法では、6ビット目に1をセットするだけでよい。また、数字から48を減じれば、対応する値が得られる。この変換は、5ビット目及び6ビット目に0をセットするか、あるいは単純に上位4ビットを無視するだけでもよい。なお、印字可能文字のうち、"@"から始まる32文字については、ASCII値を64減じて対応する制御文字を求め、この制御文字を"コントロール+"(英:control+)という前置表現を付けた印字可能文字で表記する慣習がある。
BELコード(07)→"コントロール+G"(受信した側の機器で注意喚起音が鳴る)
この制御文字の表記方法は、キーボード上の印字可能文字キーを制御文字の送出に用いていた機器の名残りであると考えられる(7ビット目を0にセットする専用キー(Ctrlキー)を、印字可能文字キーと同時に押して制御文字を送出)。

[編集] 参考文献

ANSI INCITS 4-1986 (formerly ANSI X3.4-1986) American National Standard for Information Systems ― Coded Character Sets ― 7-Bit American National Standard Code for Information Interchange (7-Bit ASCII), American National Standards Institute (1963年6月17日制定, 1986年3月26日最終改正, 2002年1月15日規格番号変更).

[編集] 関連項目

最終更新 2009年9月15日 (火) 02:58 (日時は個人設定で未設定ならばUTC)。
【ASCII】変更履歴

ご利用上の注意

もっと調べる!