计算机应用基础
上QQ阅读APP看本书,新人免费读10天
设备和账号都新为新人

1.3.1 西文字符的编码

字符的编码采用国际通用的ASCII码(美国信息交换标准代码),每个ASCII码以1个字节(Byte)存储,从数字0~127代表不同的常用符号,如大写A的ASCII码是65,小写a的ASCII码是97。

ASCII码中有许多外文和表格等特殊符号,成为目前常用的编码。基本的ASCII字符集共有128个字符,其中有96个可打印字符,包括常用的字母、数字、标点符号等,另外还有32个控制字符。标准ASCII码使用7个二进位对字符进行编码,对应的ISO标准为ISO 646标准。

标准ASCII码是7位编码,但由于计算机基本处理单位为字节(1Byte = 8bit),所以一般仍以一个字节来存放一个ASCII字符。每个字节中多余出来的一位(最高位)在计算机内部通常保持为0(在数据传输时可用作奇偶校验位)。由于标准ASCII字符集字符数目有限,在实际应用中往往无法满足要求。为此,国际标准化组织又制定了ISO 2022标准,它规定了在保持与ISO 646兼容的前提下将ASCII字符集扩充为8位代码的统一方法。ISO陆续制定了一批适用于不同地区的扩充ASCII字符集,每种扩充ASCII字符集分别可以扩充128个字符,这些扩充字符的编码均为高位为1的8位代码(即十进制数为128~255),称为扩展ASCII码。