好好学Java:从零基础到项目实战
上QQ阅读APP看书,第一时间看更新

5.1.2 字符型与整型的相互转化

字符类型是一种新的变量类型,然而在编码实践的过程中,发现某个具体的字符值居然可以赋值给整型变量。就像下面的代码一样,把字符值赋给整型变量,编译器不但没报错,而且还能正常运行(完整代码见本章源码的src\com\string\character\intToChar.java)。

    // 字符允许直接赋值给整型变量
    private static void charToInt() {
        int a='A';  // 把一个字符赋值给整型变量
        System.out.println("int a="+a);
        int tian='田';  // 把一个字符赋值给整型变量
        System.out.println("int tian="+tian);
    }

马上运行上面的测试代码,输出日志如下:

int a=65
int tian=30000

之所以出现字符变成整数的情况,是因为计算机为了方便处理,将包括英文在内的拉丁字母都采用数字编码,这样字符才能保存在只认得二进制数的计算机系统中。因为计算机编程诞生在西方,所以早期的编程语言只支持英语和其他西欧语言。英文字母才26个,区分大小写也才52个,加上标点符号等,最多128个,只用一字节来表达西方世界的字符已然绰绰有余(一字节为8位二进制数,可表达255个数值)。这套单字节的字符编码标准源自美国,故而它被称作ASCII码(American Standard Code for Information Interchange,美国信息交换标准代码)。

计算机编程传播到其他国家时发现了问题,很多国家都有自己的语言文字,像常用的汉字就有3000多个,单字节的ASCII码根本不够用。于是后来又制定了DBCS(Double-Byte Character Set,双字节字符集)标准,该标准使用两字节来表示一个字符,这样一共可以表示256×256-1=65535个字符,其中前128个字符与ASCII码保持一致,剩余的位置留给了别的语言文字和扩展符号。其中,以汉字为主的东亚象形文字占据了从0x3000~0x9FFF之间的编码,足足占去了DBCS所有字符的7/16。

既然字符值允许直接赋予整型变量,反过来整数(0~65535)也能直接赋予字符变量。譬如整数65赋值给字符变量就变成了字母A,整数30000赋值给字符变量就变成了汉字“田”。当然只有0~65535之间的整数才能正常给字符变量赋值,因为其他整数不在Java的字符型范围之内。下面是将整数赋值给字符型变量的代码例子:

    // 0~65535之间的整数允许直接赋值给字符变量。字符类型占两字节
    private static void intToChar() {
        char a=65;  // 把一个数字赋值给字符变量
        System.out.println("char a="+a);
        char tian=30000;  // 把一个数字赋值给字符变量
        System.out.println("char tian="+tian);
        // 以汉字为主的东亚象形文字(中、日、韩)占据了从0x3000~0x9FFF之间的编码
        char begin=0x3000;
        System.out.println("chinese begin="+begin);
        char end=0x9FFF;
        System.out.println("chinese end="+end);
        char max=65535;  // 字符型可表达的范围是0~65535
        System.out.println("char max="+max);
    }

上面说到整型数与字符型之间允许直接相互赋值,也就是说可以把字符变量当作整型变量看待,这意味着字符变量也能参与加减乘除四则运算。不过一旦字符变量参与计算,由于编译器不能确定计算结果是否还落在0~65535的整数区间,因此必须显式地把运算结果强制转换成字符char类型。以打印所有的大写英文字母为例,只要指定了初始字符为A,那么便能对初始字符逐次加1,从而完成从A~Z之间所有字符的遍历操作。具体的大写字母遍历代码示例如下:

    // 字符变量允许跟整数直接加减乘除
    private static void printCapital() {
        char a='A';
        for (int i=0; i<26; i++) {  // 英语的大写字母总共有26个
            // 因为不确定a+i之和是否超出0~65535的范围,所以需要强制转换成字符类型
            char capital=(char) (a+i);
            System.out.println("capital="+capital);
        }
    }