字符和字符串
1.1 ASCLL码
键盘中有一些字符数字,还有在屏幕总无法打印出来的,用于控制计算机的字符,上下键,Delete等等
由于计算机硬件只能识别0101这样的二进制数,所以用一定规则映射成0101这样的二进制数
常用控制字符共128个 =7位的二进制编码=27=128
一个bit表示0和1两种,用来代表二进制位,8个bit便可以表示256种情况=28
通常计算机处理数据的时候1个字节为处理单位=8bit
可印刷字符:32~126,其余为控制、通信字符
数字:48对应二进制为(00110000)=(0011 0000)~57(0011 1001) 0011相同,后面0000、1001刚好代表十进制数为0-9
大写字母:65对应二进制为(01000001)=(0100 0001)~90(0101 1010) 010相同,后面00001、11010代表的十进制数为0、26,范围就是0-26
小写字母:97对应二进制为(01100001)=(0110 0001)~122(0111 1010) 010相同,后面00001、11010代表的十进制数为0、26,范围就是0-26
1.2 汉字的表示和编码
GB 2312-80:汉字+各种符号共7445个
区位码:94个区,每个区94个位置 相当于一个格子(区,位)
国标码:在区位码基础上每个区位加上20H,防止信息交换时“控制/通信字符冲突”
区位码需要在加上20H,就是32的16进制表示,因为控制编码位于0-32.为了防止计算机把识别的字符当成指令,
所以区位码都会从32开始,而不是从0开始,这时候ASCLL码表,表示汉字的范围是32-125
汉字内码:在国标码基础上每个区位+80H(80H十六进制对应10000000二进制 最高位为1 ),ASCLL码最高位为0,加上1的话,保证与ASCLL码区分,不重合。就在原来的基础上加128,这时候一个计算机判断输入的字符为一个字节<128,就说明这是一个英文字符。如果计算机读了一个字节,还有下一个字节,把这两个字节组合起来,就能对应上一个汉字
输出:汉字字形码
1.3 字符串
英文字符
中文字符