深度剖析数据在内存中的存储(超详细版){上}+https://developer.aliyun.com/article/1413423
下面设计代码来检验数据存储的方式是小端还是大端:
分析过程:
代码如下:
//设计代码验证数据的存储方式 int check_sys() { int a = 1;//00 00 00 01 char* p = (char*)&a;//对a进行强制类型转换,只取他的首地址 if (*p == 1) return 1; else return 0; } int main() { int ret =check_sys(); if (ret == 1) printf("小端\n"); else printf("大端\n"); return 0; }
几个经典代码练习帮助理解:
练习1:
//输出什么? #include <stdio.h> int main() { char a= -1; signed char b=-1; unsigned char c=-1; printf("a=%d,b=%d,c=%d",a,b,c); return 0; } //a=-1,b=-1,c=255
下面详细讲解一下:
练习2:
int main() { char a = -128; //先想-128是否属于char类型的数据范围之内(-128~127)属于 //直接写出二进制序列:10000000 //整形提升:111111111111111111111111100000000 //%u:是以无符号整型输出,数据范围是恒>=0的,所以其原码=反码=补码 //输出结果:4294967168 printf("%u\n", a); return 0; }
练习3:
int main() { char a = 128; //128不属于char类型的数据范围之内-128~127 //先写补码,再利用截断 //00000000000000000000000010000000(2^7=128) //01111111111111111111111101111111 //01111111111111111111111110000000 //截断:10000000(和练习2中a存储的数据相同,故答案相同) //输出结果:4294967168 printf("%u\n", a); return 0; }
练习4:
int main() { int i = -20; //10000000000000000000000000010100 //11111111111111111111111111101011 //11111111111111111111111111101100->-20的补码 unsigned int j = 10; //00000000000000000000000000001010->原反补相同 //相加:11111111111111111111111111110110 //:11111111111111111111111111110101 //:10000000000000000000000000001010->-10 //输出结果:-10 printf("%d\n", i + j); return 0; }
练习5:
int main() { unsigned int i; for (i = 9; i >= 0; i--) { printf("%u\n", i); } //i=0之后进行i--的操作,i=-1 //但是i是unsigned int的类型,并不包括负数,所以要先写补码,再截断(这道题不用截断) //10000000000000000000000000000001 //11111111111111111111111111111110 //11111111111111111111111111111111->i中存储的数据(注意首位并不是符号位,而是数值位) //最后会发生死循环 return 0; }
练习6:
int main() { char a[1000]; int i; for (i = 0; i < 1000; i++) { a[i] = -1 - i; } printf("%d", strlen(a)); //输出:255 return 0; }
练习7:
unsigned char i = 0; int main() { for (i = 0; i <= 255; i++) { printf("hello world\n"); } //先想unsigned char数据类型的数据范围:0~255 //而我的i<=255,所以此代码会循环打印hello world return 0; }
读者可以重点看练习1中的总结,了解基本的做题规则与想法,那才是精华!
4.浮点型数据在内存中的存储
基本概念:
常见的浮点数及表示方法
3.14,2.718.......
1e2 ->1*10^2 e是指数exponent(指数)的缩写,常被用作科学记数法中的指数
1E3 ->1*10^3
浮点型家族:float,double,long double
注意:如果没有强制定义,写出一个小数会默认为double类型,如果需要的话可以加上后缀f
先看代码:
/*浮点型数据存储的一个引例*/ int main() { int n = 9; float* pFloat = (float*)&n; printf("n的值为:%d\n", n); printf("*pFloat的值为:%f\n", *pFloat); *pFloat = 9.0; printf("num的值为:%d\n", n); printf("*pFloat的值为:%f\n", *pFloat); return 0; }
读者能答出所有答案吗?你的答案是: 9;9.0;9;9.0吗?下面请看答案:
有没有发现第二个和第三个数的结果十分奇怪?由这个现象我们不难猜出:“整型数据的存储和浮点型数据的存储应该是不同的”,那该如何解释这个现象,我们首先要了解浮点型数据在内存中的存储方式 :
根据国际标准IEEE(电气和电子工程协会) 754,任意一个二进制浮点数V可以表示成下面的形式:
V = (-1)^S * M * 2^E(一定要牢记这个公式,后面的存储也会用到)
- S 符号位,用于表示浮点数的正负 S=0,V>0; S=1,V<0;
- M 有效数字 1<M<2
- E exponent 指数
将一个整型数据转化为对应的二进制浮点数的方法:将整数位和小数位分开写,分别写出对应的二进制。
例如:
对于一个浮点型数据来说,其实很难表示后面的小数位,比如3.14这个数字,你很难找到合适的表示方法,小数位的表示是通过2的权重来表示的,比如小数点后一位对应的是2^(-1),第二位对应的是2^(-2),以此类推。
浮点型数据在内存中的存储
介绍完浮点型数据的表示方法,接下来介绍浮点型数据在内存中的存储。
我们知道,整型数据在内存中的存储是通过其对应二进制的补码存放的,但无论怎样,在计算机中存储数据只能存储其对应的二进制位,对于浮点型数据来说,在内存中的存储也是存储其对应的二进制序列,下面请看:
V = (-1)^S * M * 2^E
可见,一个二进制浮点数是通过S,E,M的组合形成的,所以,二进制浮点数在内存中的存储也是通过存储S,E,M来存储对应的二进制序列
S,E,M具体存储规则
- S:只存一个数字:0->正数 1->负数
- E:存储方式比较复杂,具体来说在内存中存储的E的值比真实值大127
- M:对于一个有效数字来说,整数位一定为1,所以在存储的时候,为了能够更多的存储小数位,首位的1就不在存到内存之中,也就是M对应的内存空间存储的全是小数位!如果位数不够,在后面一直补零即可。 在读取时,将所有的小数位读取之后,系统会自动补1
一个例子:
Tip:关于E的提取要分为三种情况(第一二种情况了解即可)
现在,让我们回到最初的那道题目:
两种情况其实就是视角的不同而造成的数字差异
1.以整型存,以浮点型看
2.以浮点型存,以整形看
注意:这不同于强制类型转换,强制类型转换后其结果对应的二进制序列发生了改变,本题只是以不同的视角来看同一个数,并没有改变其对应的二进制序列!
结语:
相信看到这里大家对于数据在内存中的存储有了更深的了解,要知道整形数据的存储与浮点型数据的存储方式是不同的;要知道整形家族的分类,了解每类的数据范围(尤其是char 和Unsigned char类型),了解截断思想;这些内容帮助我们很好的修炼了我们的“内功”,会对未来更深入的学习有很大的帮助!