【深度剖析】数据在内存中的存储(下)

简介: 【深度剖析】数据在内存中的存储

三 .大小端字节序介绍及判断


c37969fb569549589174925384244540.png

下面是大小端存储的图解:

081af132680f4fecb68d22e807d8e964.png

8ca8c26b4ad34437a41372f360e4a4d7.png

由上图可以看见,在此机器上为小端存储,这也很好的验证了上面的fffffff6为什么在内存中以字节为单位是反向存放的。


那么为什么会有大小端之分呢?

1. 一开始是由于不同架构的CPU处理多个字节数据的顺序不一样,比如x86的是小段模式,KEIL C51是大端模式。但是后来互联网流行,TCP/IP协议规定为大端模式,为了跨平台通信,还专门出了网络字节序和主机字节序之间的转换接口(ntohs、htons、ntohl、htonl)

2. 大小端模式各有优势:小端模式强制转换类型时不需要调整字节内容,直接截取低字节即可;大端模式由于符号位为第一个字节,很方便判断正负。


这里插入一道关于大小端的经典习题:

d058fc99c21a4a8a83ed0637971af7eb.png

0fbf2379b7734d88be29834a4460f7fd.png

思路:定义一个变量a=1;将其转换为十六进制形式表示,将整形数据强制转化为字符型,用字符指针去接受并且访问第一个字节,如果第一个字节是0,那么就是小端存储,如果是1,就是大端存储.


代码块如下:

intmain()
{
inta=1;
char*p= (char*)&a;//将整形a强制类型转为字符型指针,去访问第一个字节if (*p==1)
printf("小端\n");
elseprintf("大端\n");
return0;
}


四. 浮点数在内存的存储解析


根据国际标准IEEE(电气和电子工程协会) 754,任意一个二进制浮点数V可以表示成下面的形式:


(-1) ^ S * M * 2 ^ E


其中:

(-1) ^ S 表示符号位,当S=0,V为正数;当S=1,V为负数

M 表示有效数字,大于等于1,小于2

2 ^ E 表示指数


假设我们要将5.5这个浮点数存到内存中,首先将5.5转化为二进制形式,即:101.1;

接着更具754规则,将其转化为(-1) ^ S * M * 2 ^ E格式,如下图:


33995a8394b940409bdcbddb3d8a7327.png

IEEE 754 规定:

1)对于32位的浮点数,最高位的1位是符号位s,接着的8位是指数E,剩下的23位为有效数字M;

7f1af7f1315a4f3fb28e845ed1dbed63.png

2)对于64位的浮点数,最高位的1位是符号位s,接着的11位是指数E,剩下的52位为有效数字M;


IEEE 754 对有效数字 M 和指数 E ,还有一些特别规定。

前面说过, 1≤M<2 ,也就是说, M 可以写成 1.xxxxxx 的形式,其中 xxxxxx 表示小数部分。IEEE 754 规定,在计算机内部保存 M 时,默认这个数的第一位总是 1 ,因此可以被舍去,只保存后面的xxxxxx 部分。比如保存 1.01 的时候,只保存 01 ,等到读取的时候,再把第一位的 1 加上去。这样做的目的,是节省 1 位有效数字。以 32 位

浮点数为例,留给 M 只有 23 位,将第一位的 1 舍去以后,等于可以保存 24 位有效数字。


至于指数 E ,情况就比较复杂。


首先, E 为一个无符号整数( unsigned int )

这意味着,如果 E 为 8 位,它的取值范围为 0~255 ;如果 E 为 11 位,它的取值范围为 0~2047 。但是,我们知道,科学计数法中的 E 是可以出现负数的,所以 IEEE 754 规定,存入内存时 E 的真实值必须再加上一个中间数,对于 8 位的 E ,这个中间数是 127 ;对于 11 位的 E ,这个中间数是 1023 。比如, 2^10 的 E 是 10 ,所以保存成 32 位浮点数时,必须保存成 10+127=137 ,即10001001 。

然后,指数 E 从内存中取出还可以再分成三种情况:

E 不全为 0 或不全为 1

这时,浮点数就采用下面的规则表示,即指数 E 的计算值减去 127 (或 1023 ),得到真实值,再将有效数字 M 前加上第一位的 1 。

比如:

0.5 ( 1/2 )的二进制形式为 0.1 ,由于规定正数部分必须为 1 ,即将小数点右移 1 位,则为1.0*2^(-1) ,其阶码为 -1+127=126 ,表示为01111110 ,而尾数 1.0 去掉整数部分为 0 ,补齐 0 到 23 位 00000000000000000000000 ,则其二进制表示形式为 :

E 全为 0

这时,浮点数的指数 E 等于 1-127 (或者 1-1023 )即为真实值,

有效数字 M 不再加上第一位的 1 ,而是还原为 0.xxxxxx 的小数。这样做是为了表示 ±0 ,以及接近于

0 的很小的数字。

0 01111110 00000000000000000000000

E 全为 1

这时,如果有效数字 M 全为 0 ,表示 ± 无穷大(正负取决于符号位 s );

好了,关于浮点数的表示规则,就说到这里,对于上述问题,想必大家阅读了也是很抽象,接下来我们举个例子来看看:

1)以整形存进去,以浮点数打印:

2b640dd176c74c049f442922aed41fa9.png

这里为什么会打印出0呢?

7f1af7f1315a4f3fb28e845ed1dbed63.png

 2)以浮点数存进去,以整形打印:

1a7b7d5b649947c1bdd8830aef91f3b6.png

解释:

e470cf2152764b0c8705c0cd4a80116c.png

到这里关于浮点数的存储就讲完了,关于浮点数,我们知道就可,不必深究。

如果对上文有意见或者有错误,还请大佬们斧正,觉得有帮助的童鞋们,蟹蟹三连!

目录
相关文章
|
4天前
|
存储 编译器 数据处理
C 语言结构体与位域:高效数据组织与内存优化
C语言中的结构体与位域是实现高效数据组织和内存优化的重要工具。结构体允许将不同类型的数据组合成一个整体,而位域则进一步允许对结构体成员的位进行精细控制,以节省内存空间。两者结合使用,可在嵌入式系统等资源受限环境中发挥巨大作用。
24 11
|
27天前
|
监控 算法 应用服务中间件
“四两拨千斤” —— 1.2MB 数据如何吃掉 10GB 内存
一个特殊请求引发服务器内存用量暴涨进而导致进程 OOM 的惨案。
|
26天前
|
存储 C语言
数据在内存中的存储方式
本文介绍了计算机中整数和浮点数的存储方式,包括整数的原码、反码、补码,以及浮点数的IEEE754标准存储格式。同时,探讨了大小端字节序的概念及其判断方法,通过实例代码展示了这些概念的实际应用。
55 1
|
30天前
|
存储
共用体在内存中如何存储数据
共用体(Union)在内存中为所有成员分配同一段内存空间,大小等于最大成员所需的空间。这意味着所有成员共享同一块内存,但同一时间只能存储其中一个成员的数据,无法同时保存多个成员的值。
|
1月前
|
监控 Java easyexcel
面试官:POI大量数据读取内存溢出?如何解决?
【10月更文挑战第14天】 在处理大量数据时,使用Apache POI库读取Excel文件可能会导致内存溢出的问题。这是因为POI在读取Excel文件时,会将整个文档加载到内存中,如果文件过大,就会消耗大量内存。以下是一些解决这一问题的策略:
87 1
|
4月前
|
存储 分布式计算 Hadoop
HadoopCPU、内存、存储限制
【7月更文挑战第13天】
288 14
|
3月前
|
存储 编译器 C语言
【C语言篇】数据在内存中的存储(超详细)
浮点数就采⽤下⾯的规则表⽰,即指数E的真实值加上127(或1023),再将有效数字M去掉整数部分的1。
378 0
|
1月前
|
存储 弹性计算 算法
前端大模型应用笔记(四):如何在资源受限例如1核和1G内存的端侧或ECS上运行一个合适的向量存储库及如何优化
本文探讨了在资源受限的嵌入式设备(如1核处理器和1GB内存)上实现高效向量存储和检索的方法,旨在支持端侧大模型应用。文章分析了Annoy、HNSWLib、NMSLib、FLANN、VP-Trees和Lshbox等向量存储库的特点与适用场景,推荐Annoy作为多数情况下的首选方案,并提出了数据预处理、索引优化、查询优化等策略以提升性能。通过这些方法,即使在资源受限的环境中也能实现高效的向量检索。
|
1月前
|
存储 编译器
数据在内存中的存储
数据在内存中的存储
42 4
|
1月前
|
存储 Java
JVM知识体系学习四:排序规范(happens-before原则)、对象创建过程、对象的内存中存储布局、对象的大小、对象头内容、对象如何定位、对象如何分配
这篇文章详细地介绍了Java对象的创建过程、内存布局、对象头的MarkWord、对象的定位方式以及对象的分配策略,并深入探讨了happens-before原则以确保多线程环境下的正确同步。
53 0
JVM知识体系学习四:排序规范(happens-before原则)、对象创建过程、对象的内存中存储布局、对象的大小、对象头内容、对象如何定位、对象如何分配