整数在内存中的存储
整数的2进制表示方法有三种,即原码、反码和补码
三种表示方法均有符号位和数值位两部分,符号位都是0表用示“正”,用1表示“负”,而最高的一位是被当做符号位,剩余的都是数值位。
正整数的原、反、补码都相同。
负整数的三种表示方法各不相同。
原码:直接将数值按照正负数的形式翻译成二进制得到的就是原码。
反码:将原码的符号位不变,其他位依次按位取反就可以得到反码。
补码:反码+1就得到补码。
对于整形来说:数据存放内存中其实存放的是补码。
为什么呢?
在计算机系统中,数值一律用补码来表示和存储。
原因在于,使用补码,可以将符号位和数值域统⼀处理;
同时,加法和减法也可以统⼀处理(CPU只有加法器)此外,补码与原码相互转换,其运算过程是
相同的,不需要额外的硬件电路。
1.1大小端字节序和字节序判断
大小端:
其实超过一个字节的数据在内存中存储的时候,就有存储顺序的问题,按照不同的存储顺序,我们分为大端字节序存储和小端字节序存储,下面是具体的概念:
大端(存储)模式:是指数据的低位字节内容保存在内存的高地址处,而数据的高位字节内容,保存在内存的低地址处。
小端(存储)模式:是指数据的低位字节内容保存在内存的低地址处,而数据的高位字节内容,保存在内存的高地址处。
上述概念需要记住,方便分辨大小端。
举一个简单整数存储例子 :
#include <stdio.h> int main() { char a = -1;//char是否有符号,取决于编译器,在这里,我们以有符号举例 signed char b = -1; unsigned char c = -1; printf("a=%d,b=%d,c=%d", a, b, c);// -1, -1, 255 return 0; }
分析:(32位)
-1的原码:10000000000000000000000000000001
-1的反码:11111111111111111111111111111110
-1的补码:11111111111111111111111111111111
有符号char:
a是char类型,单位1字节,所以a在计算机中存储的二进制为11111111(发生了截断)
而打印是以有符号的整型形式打印,char类型要发生整型提升
整型提升:
有符号数:高位补符号位,直到补齐32位
无符号数:高位补0,直到补齐32位
所以,最终a整型1提升后的补码是11111111111111111111111111111111,打印是以二进制的原码形式转换成十进制打印的 -> -1
无符号char:
首先将-1进行补码形存储。
除了整型提升不同外,其余于上述雷同。
c整型提升后的补码是 00000000000000000000000011111111, 打印是以二进制的原码形式转换成十进制打印的 -> 255
假设下面以小端字节序存储:
#include <stdio.h> int main() { int a[4] = { 1, 2, 3, 4 }; int *ptr1 = (int *)(&a + 1); int *ptr2 = (int *)((int)a + 1); printf("%x,%x", ptr1[-1], *ptr2);//4,2000000 return 0; }
分析:
a 存储在内存中为(十六进制形式下):
01000000 02000000 03000000 04000000
- int *ptr1 = (int *)(&a + 1); 这行代码将ptr1指向数组a之后的内存位置。由于&a给出的是整个数组的地址,加上1会使指针跳过整个数组,指向数组之后的内存位置。ptr1[-1]实际上是访问这个新位置之前的内存单元,也就是数组a的最后一个元素,即4。
- int *ptr2 = (int *)((int)a + 1);假设a的首元素地址为0x0012ff40, 这里首先将数组a的地址转换为整型(通过(int)a),然后加1,a的值为0x0012ff41。之后,又将整型 a 强制类型转换为 int * 。由于a是一个指向整型的指针,此时,ptr2指向第一个元素的第二个字节。ptr2解引用,从第一个元素的第二个字节开始数4个字节,作为一个元素,即00000002以小端字节序存储:0x02000000
- printf("%x,%x", ptr1[-1], *ptr2);这行代码以十六进制格式打印出ptr1[-1]和*ptr2的值。