1.3计算机中信息的表示
1.3.1信息的表示
信息表示广义来说泛指信息的获取、描述、组织全过程,狭义来说指其中的信息描述过程。
信息表示需要一套符号系统。信息表示的符号系统有三个基本特点:
1)存在一个基本的有限符号集,符号集中符号的数目多于一个。
2)不同符号有明显的差别,便于人们识别和感知这些符号。
3)存在一组规则,按照规则可以将基本符号组成更复杂的结构。
1.3.2 数制及其转换
名词术语
数制:用进位的原则进行计数称为进位计数制,简称数制。
数码:数制中表示基本数值大小的不同数字符号,在一种数制中,只能使用一组固定的数字俩表示数的大小。
基数:数制所使用的数码个数。常用“R"表示,称R进制
位权:指数码在不同位置上的权值。在进位计数制中,处于不同数位的数码代表的数值不同。
推理:第n位的权值便是Rn-1,如果是小数点后面的第m位,则其权值为R-m。
常见进制:
进制 数码 基数 位权
二进制 2
八进制 8
十进制 10
十六进制 16
数制的表示
在计算机内部存储、处理和传递的信息均采用二进制代码来表示,二进制的基数为2,只有“0‘和”1“两个数码。
容易表示,电压高。开关的接通与断开都可以用“0”和“1”来表示。
节省设备,状态简单,抗干扰能力强,可靠性高。
易于转换,跟不同数制间的转换。
便于进行算术运算和逻辑运算。
八进制和十六进制对二进制的转换十分方便,同时又能将大的二进制以较短的字数来表示,便于人们书写和记录,所以使用八进制和十六进制来表达二进制数。
数值的表示
进制 后缀 表示1 表示2 进位规则
二进制 B
八进制 O
十进制 D
十六进制 H
R进制转为十进制数
方法:位权展开式
求位权
按权展开(数码*位权),求和
十进制转为R进制数
十进制数的整数部分和小数部分在转换时需作不同的计算
分别求值后再组合。
基本规则:
整数部分:除基去余,逆序排列
小数部分:乘基去整,顺序排列
部分十进制小数无法用二进制精确表示
二进制转为八进制
方法:三位并一位
八进制转为二进制数
方法:一位拆三位
二进制转为十六进制
方法:四位并一位
十六进制转为二进制
方法:一位拆四位
二进制的算术运算规则
加法规则:
0+0=0;0+1=1;
1+0=1;1+1=10
减法规则:
0-0=0;10-1=1;
1-0=1;1-1=0
乘法规则:
0X0=0;0X1=0;
1X0=0;1X1=1;
除法规则:
0/1=0;1/1=1
二进制的逻辑运算规则
与运算:有0为0,全1为1
或运算:有1为1,全0为0
异或运算:相同为0,不同为1
非运算:
1.3.3信息的编码
数据的单位
1)位(bit)
简记为b,也称为比特,是计算机存储数据的最小单位。一个二进制位只能表示0或1。
2)字节(Byte)
简记为B。字节是存储信息的基本单位。规定1B=8bit
1KB=210B
1MB=220B=1024KB
1GB=230B =1024MB
1TB=240B=1024GB
1PB=250B=1024TB
3)字(Word)
计算机进行数据处理时,CPU一次存取、加工和传送的数据称为字。一个字通常由一个字节或若干字节组成。
4)字长
字长是计算机一次所能处理数据的实际位数长度,字长是衡量计算性能的一个重要指标。字长越长,运算速度越快,精度越高
数值的表示
采用二进制表示形式的联通数符一起代码化了数据,在计算机中统称为机器数或机器码。
而与机器数对应的用正、负符号加绝对值来表示的实际数值称为真值。
有符号数:数的正负号也用“0”和“1”表示。通常规定一个数的最高位作为符号位,“0”表示正,“1”表示负。
无符号数是相对于有符号数而言的,指的是整个机器字长的全部二进制均表示数值位。
为了在计算机的输入输出操作中能直观迅速地与常用的十进制数相对应,习惯上用二进制代码表示十进制数,这种编码方法简称BCD码或8421编码。
BCD码用4位二进制数表示一位十进制数
字符编码
目前采用的字符编码主要是ASCII码,它是美国标准信息交换代码的缩写,已被国际标准化组织(ISO)采纳,作为国际通用的信息交换标准代码。
ASCII码是一种西文机内码,分为两种:
标准ASCII码:7位ASCII码
扩展ASCII码:8位ASCII码
标准ASCII码:标准ASCII码用一个字节(8位)表示一个字符,并规定其最高位为0,实际只用到7位因此可以表达128个不同字符。
扩展ASCII码:8位的ASCII编码:可表示256个不同的字符
常用的ASCII编码
空格 数字0 数字9 A Z a z
32 48 57 65(41H) 90 97 122
0100000 0110000 0111001 1000001 1011010 1100000 1111010
比较大小:空格 <数字 <大写<小写
大小写字母转换:小写=大写+32(20H)
汉字编码
a)汉字交换码:
由于汉字数量极多,一般用连续的两个字节(16个二进制位)来表示一个汉字。
1980年,我国颁布了第一个汉字编码字符集标准,即GB2312-80《信息交换用汉字编码字符集基本集》,该标准编码简称国标码,是我国大陆地区及新加坡等海外华语区通用的汉字交换码
b)汉字机内码
国标码GB2313不能直接在计算机中使用,因为它没有考虑与基本的信息交换代码ASCII码的冲突。
为了区分汉字与ASCII码,在计算机内部表示汉字时,把交换码(国标码)两个字节的最高位改为1,称为机内码。
机内码是真正的计算机内部用来存储和处理汉字信息的代码。
c)汉字字形码
用来将汉字显示到屏幕上或打印到纸上所需要的图形数据。汉字字形码记录汉字的外形,是汉字的输出形式。
记录汉字字形通常有两种方法:点阵法和矢量法,分别对应两种字形编码:点阵码和矢量码。
所有的不同的字体、字号的汉字字形构成汉字库
点阵码是一种用点阵表示汉字字形的编码,它把汉字按字形排列成点阵
特点:缩放容易失真,汉字的清晰程度与点阵的规模有关
用8X8的点阵存储一个汉字占8B
d)汉字输入码
将汉字通过键盘输入到计算机中采用的代码称为汉字输入码,也称为汉字外部码(外码)
根据编码规则,可分为流水码、音码、形码和音形结合码
1.3计算机中信息的表示
1.3.1信息的表示
信息表示广义来说泛指信息的获取、描述、组织全过程,狭义来说指其中的信息描述过程。
信息表示需要一套符号系统。信息表示的符号系统有三个基本特点:
1)存在一个基本的有限符号集,符号集中符号的数目多于一个。
2)不同符号有明显的差别,便于人们识别和感知这些符号。
3)存在一组规则,按照规则可以将基本符号组成更复杂的结构。
1.3.2 数制及其转换
名词术语
数制:用进位的原则进行计数称为进位计数制,简称数制。
数码:数制中表示基本数值大小的不同数字符号,在一种数制中,只能使用一组固定的数字俩表示数的大小。
基数:数制所使用的数码个数。常用“R"表示,称R进制
位权:指数码在不同位置上的权值。在进位计数制中,处于不同数位的数码代表的数值不同。
推理:第n位的权值便是Rn-1,如果是小数点后面的第m位,则其权值为R-m。
常见进制:
进制 数码 基数 位权
二进制 2
八进制 8
十进制 10
十六进制 16
数制的表示
在计算机内部存储、处理和传递的信息均采用二进制代码来表示,二进制的基数为2,只有“0‘和”1“两个数码。
容易表示,电压高。开关的接通与断开都可以用“0”和“1”来表示。
节省设备,状态简单,抗干扰能力强,可靠性高。
易于转换,跟不同数制间的转换。
便于进行算术运算和逻辑运算。
八进制和十六进制对二进制的转换十分方便,同时又能将大的二进制以较短的字数来表示,便于人们书写和记录,所以使用八进制和十六进制来表达二进制数。
数值的表示
进制 后缀 表示1 表示2 进位规则
二进制 B
八进制 O
十进制 D
十六进制 H
R进制转为十进制数
方法:位权展开式
求位权
按权展开(数码*位权),求和
十进制转为R进制数
十进制数的整数部分和小数部分在转换时需作不同的计算
分别求值后再组合。
基本规则:
整数部分:除基去余,逆序排列
小数部分:乘基去整,顺序排列
部分十进制小数无法用二进制精确表示
二进制转为八进制
方法:三位并一位
八进制转为二进制数
方法:一位拆三位
二进制转为十六进制
方法:四位并一位
十六进制转为二进制
方法:一位拆四位
二进制的算术运算规则
加法规则:
0+0=0;0+1=1;
1+0=1;1+1=10
减法规则:
0-0=0;10-1=1;
1-0=1;1-1=0
乘法规则:
0X0=0;0X1=0;
1X0=0;1X1=1;
除法规则:
0/1=0;1/1=1
二进制的逻辑运算规则
与运算:有0为0,全1为1
或运算:有1为1,全0为0
异或运算:相同为0,不同为1
非运算:
1.3.3信息的编码
数据的单位
1)位(bit)
简记为b,也称为比特,是计算机存储数据的最小单位。一个二进制位只能表示0或1。
2)字节(Byte)
简记为B。字节是存储信息的基本单位。规定1B=8bit
1KB=210B
1MB=220B=1024KB
1GB=230B =1024MB
1TB=240B=1024GB
1PB=250B=1024TB
3)字(Word)
计算机进行数据处理时,CPU一次存取、加工和传送的数据称为字。一个字通常由一个字节或若干字节组成。
4)字长
字长是计算机一次所能处理数据的实际位数长度,字长是衡量计算性能的一个重要指标。字长越长,运算速度越快,精度越高
数值的表示
采用二进制表示形式的联通数符一起代码化了数据,在计算机中统称为机器数或机器码。
而与机器数对应的用正、负符号加绝对值来表示的实际数值称为真值。
有符号数:数的正负号也用“0”和“1”表示。通常规定一个数的最高位作为符号位,“0”表示正,“1”表示负。
无符号数是相对于有符号数而言的,指的是整个机器字长的全部二进制均表示数值位。
为了在计算机的输入输出操作中能直观迅速地与常用的十进制数相对应,习惯上用二进制代码表示十进制数,这种编码方法简称BCD码或8421编码。
BCD码用4位二进制数表示一位十进制数
字符编码
目前采用的字符编码主要是ASCII码,它是美国标准信息交换代码的缩写,已被国际标准化组织(ISO)采纳,作为国际通用的信息交换标准代码。
ASCII码是一种西文机内码,分为两种:
标准ASCII码:7位ASCII码
扩展ASCII码:8位ASCII码
标准ASCII码:标准ASCII码用一个字节(8位)表示一个字符,并规定其最高位为0,实际只用到7位因此可以表达128个不同字符。
扩展ASCII码:8位的ASCII编码:可表示256个不同的字符
常用的ASCII编码
空格 数字0 数字9 A Z a z
32 48 57 65(41H) 90 97 122
0100000 0110000 0111001 1000001 1011010 1100000 1111010
比较大小:空格 <数字 <大写<小写
大小写字母转换:小写=大写+32(20H)
汉字编码
a)汉字交换码:
由于汉字数量极多,一般用连续的两个字节(16个二进制位)来表示一个汉字。
1980年,我国颁布了第一个汉字编码字符集标准,即GB2312-80《信息交换用汉字编码字符集基本集》,该标准编码简称国标码,是我国大陆地区及新加坡等海外华语区通用的汉字交换码
b)汉字机内码
国标码GB2313不能直接在计算机中使用,因为它没有考虑与基本的信息交换代码ASCII码的冲突。
为了区分汉字与ASCII码,在计算机内部表示汉字时,把交换码(国标码)两个字节的最高位改为1,称为机内码。
机内码是真正的计算机内部用来存储和处理汉字信息的代码。
c)汉字字形码
用来将汉字显示到屏幕上或打印到纸上所需要的图形数据。汉字字形码记录汉字的外形,是汉字的输出形式。
记录汉字字形通常有两种方法:点阵法和矢量法,分别对应两种字形编码:点阵码和矢量码。
所有的不同的字体、字号的汉字字形构成汉字库
点阵码是一种用点阵表示汉字字形的编码,它把汉字按字形排列成点阵
特点:缩放容易失真,汉字的清晰程度与点阵的规模有关
用8X8的点阵存储一个汉字占8B
d)汉字输入码
将汉字通过键盘输入到计算机中采用的代码称为汉字输入码,也称为汉字外部码(外码)
根据编码规则,可分为流水码、音码、形码和音形结合码