深入理解计算机系统 Chapter02 | 信息的存储

简介: 深入理解计算机系统 Chapter02 | 信息的存储

1.信息的存储


通常情况下,程序将内存视为一个非常大的数组。数组的元素是由一个个的字节组成,每个字节都由一个唯一的数字来表示,称之为地址。这些所有地址的集合称为虚拟地址空间。


74.jpg

                                                     信息的存储

2.字节


1个字节是由8个位组成,在二进制中,每一位的值可能有0或者1两种状态。当这8个位全为0时,表示一个字节的最小值;当这8个位全为1时,表示最大值;如果用十进制来表示,那么一个字节的取值范围就在[0,255]之间。上面这种按照一位一位表示数据的方式称为位模式


73.jpg

                                                   位模式


3.进制转换


在C语言中,十六进制数是以0X或0x开头。字母部分可以是全部大写或全部小写或者大小写混合。


72.jpg

进制转换



二进制与十六进制之间的转换:将二进制数从右向左,每四位为一组来转换成相应的十六进制数。如果总位数不是4的倍数,那么最左边的一组会出现小于4位的情况,这时将前面进行补0。接着,将每4位为一组的二进制数进行一一转换即可得到十六进制数


71.jpg

                                        二进制与十六进制转换


如何将形如2的n次方的数快速转换为十六进制数?


2^0 = 1          0个0
2^1 = 10         1个0
2^2 = 100        2个0
2^3 = 1000       3个0
2^4 = 10000      4个0
2^5 = 100000     5个0
....
2^n = 1000...000 n个0
n = i + 4j:n除以4,j是商、i是余数,i的可能取值是0、1、2、3,因此与之对应的十六进制数是1、2、4、8
例如2^13, n = 13 = 1 + 4 * 3,因此2^13 = 0x2000


十进制与十六进制之间的转换:使用辗转相除法,每次使用得到的商来除以16,直到得到的商不能被16整除为止。将得到的余数用16进制来表示,然后自下而上书写即可得到十六进制表示。

70.jpg

十进制与十六进制转换


4.字长Words


字长决定了虚拟地址空间最大值可以到多少,对于32位机器,虚拟地址空间最大为4GB;64位机器,虚拟地址空间最大为16EB。


69.jpg

字长

大多数64位的机器做了向下兼容,因此32位机器编译的程序也可以运行在64位机器上。在64位机器上,可以通过命令gcc -m32 -o hello32 hello.c编译生成可以在32位机器上运行的程序。通过修改编译选项gcc -m64 -o hello64 hello.c,就可以编译生成在64位机器上运行的程序。


68.jpg

                                  不同类型占用不同字节空间

5.地址和字节序


一个int类型的变量x=0x01234567,假设地址位于0x100处。由于int类型占4个字节,因此x被存储在地址为0x100~0x103的内存处。


67.jpg

大端模式与小端模式

大端模式:最高有效字节存储在最前面即低地址处。IBM和Sun公司的机器大多采用大端法。小端模式:最低有效字节存储在最前面即低地址处。大多数intel兼容机采用小端模式。


// 判断大、小端模式测试程序
#include <stdio.h>
typedef unsigned char* byte_pointer;
void show_bytes(byte_pointer start, int len) {
    int i;
    for(i = 0; i < len; i++) {
        printf("%.2x", start[i]);
    }
    printf("\n");
}
void show_int(int x) {
    show_bytes((byte_pointer) &x, sizeof(x));
}

6.存储字符串


C语言中的字符串被编码为以NULL字符结尾的字符数组,其中结尾字符的十六进制表示为0x00。使用ASCII码来表示字符,在任何系统上都会得到相同的结果。于是,文本数据比二进制数据具有更强的平台独立性。


66.jpg

字符串存储


7.布尔代数


C语言中,支持按位进行布尔运算。具体如下图所示:


65.jpg

布尔代数

64.jpg

布尔运算

8.位掩码运算


对于操作数0x89ABCDEF,我们希望得到该操作数的最低有效字节的值EF,可以通过&上0xFF这样就得到了最低有效字节0x000000EF;

63.jpg

位掩码运算

9.逻辑运算


逻辑运算中,所有非零的参数都表示为true,只有参数0表示为false。逻辑运算的结果只有两种true/false,而位运算只有在特殊的数值条件下才会得到0或者1。

62.jpg

逻辑运算

10.移位运算


对于8位二进制数01100011,左移一位就是丢弃最高的1位,并在右端补1个0,具体结果如下图所示:

61.jpg

左移一位

对于右移运算,分为逻辑右移和算术右移。逻辑右移和逻辑左移只是在方向上存在差异,逻辑右移一位就是丢弃最低的1位,并在左端补一个0。

60.jpg

                                                       逻辑右移一位

对于算术右移,以下以10010101为例说明。当算术右移的操作对象的最高位等于0时,算术右移等于逻辑右移,两者没有任何差别;当操作数的最高位为1时,算术右移后,左端需要补1而不是补0;


59.jpg

                                       算术右移且操作数最高位是0


58.jpg

                                         算术右移且操作数最高位是1


虽然C语言中并没有明确的规定有符号数应该使用哪一种类型的右移方式,但实际上几乎所有的编译器以及机器的组合都是对有符号数使用算术右移;对于无符号数,右移一定是逻辑右移;


11.参考资料


[1].本文图片来源,侵权必删:https://www.bilibili.com/video/BV1cD4y1D7uR?p=6

相关文章
|
6月前
|
存储 固态存储 Linux
外部存储结构简要回顾
外部存储结构简要回顾
55 0
|
芯片
第三章 作业(7BF)【计算机系统结构】
第三章 作业(7BF)【计算机系统结构】
193 0
|
存储 Java 程序员
计算机中数据的存储(基础篇)
计算机中数据的存储(基础篇)
1198 0
|
存储 Linux Windows
信息的表示与处理 (深入理解计算机系统第二章)(上)
信息的表示与处理 (深入理解计算机系统第二章)(上)
49 0
信息的表示与处理 (深入理解计算机系统第二章)(下)
信息的表示与处理 (深入理解计算机系统第二章)(下)
75 0
|
算法
【操作系统】第三章:计算机体系结构及内存分层体系(Part2:连续物理内存分配)
【操作系统】第三章:计算机体系结构及内存分层体系(Part2:连续物理内存分配)
235 0
【操作系统】第三章:计算机体系结构及内存分层体系(Part2:连续物理内存分配)
|
存储 编译器 C语言
深入理解计算机系统-第2章信息的表示和处理
在 IEEE 754 标准中浮点数由三部分组成:符号位(sign bit),有偏指数(biased exponent),小数(fraction)。浮点数分为两种,单精度浮点数(single precision)和双精度浮点数(double precision),它们两个所占的位数不同。 • 在单精度浮点格式(C 语言的 float)中,符号位,8 位指数,23 位有效数。 • 在双精度浮点格式(C 语言的 double)中,符号位,11 位指数,52 位有效数。
187 0
|
缓存 虚拟化 芯片
【操作系统】第三章:计算机体系结构及内存分层体系(Part1:计算机体系结构)
【操作系统】第三章:计算机体系结构及内存分层体系(Part1:计算机体系结构)
270 0
|
存储 Java
【Java|基础篇】计算机中数据的存储规则
本篇文章只是为了科普 计算机中数据的存储规则。计算机的数据大致分为三类:文本数据,图片和音频,注 视频是图片和音频的结合。