【深度剖析】数据在内存中的存储(下)

简介: 【深度剖析】数据在内存中的存储

三 .大小端字节序介绍及判断


c37969fb569549589174925384244540.png

下面是大小端存储的图解:

081af132680f4fecb68d22e807d8e964.png

8ca8c26b4ad34437a41372f360e4a4d7.png

由上图可以看见,在此机器上为小端存储,这也很好的验证了上面的fffffff6为什么在内存中以字节为单位是反向存放的。


那么为什么会有大小端之分呢?

1. 一开始是由于不同架构的CPU处理多个字节数据的顺序不一样,比如x86的是小段模式,KEIL C51是大端模式。但是后来互联网流行,TCP/IP协议规定为大端模式,为了跨平台通信,还专门出了网络字节序和主机字节序之间的转换接口(ntohs、htons、ntohl、htonl)

2. 大小端模式各有优势:小端模式强制转换类型时不需要调整字节内容,直接截取低字节即可;大端模式由于符号位为第一个字节,很方便判断正负。


这里插入一道关于大小端的经典习题:

d058fc99c21a4a8a83ed0637971af7eb.png

0fbf2379b7734d88be29834a4460f7fd.png

思路:定义一个变量a=1;将其转换为十六进制形式表示,将整形数据强制转化为字符型,用字符指针去接受并且访问第一个字节,如果第一个字节是0,那么就是小端存储,如果是1,就是大端存储.


代码块如下:

intmain()
{
inta=1;
char*p= (char*)&a;//将整形a强制类型转为字符型指针,去访问第一个字节if (*p==1)
printf("小端\n");
elseprintf("大端\n");
return0;
}


四. 浮点数在内存的存储解析


根据国际标准IEEE(电气和电子工程协会) 754,任意一个二进制浮点数V可以表示成下面的形式:


(-1) ^ S * M * 2 ^ E


其中:

(-1) ^ S 表示符号位,当S=0,V为正数;当S=1,V为负数

M 表示有效数字,大于等于1,小于2

2 ^ E 表示指数


假设我们要将5.5这个浮点数存到内存中,首先将5.5转化为二进制形式,即:101.1;

接着更具754规则,将其转化为(-1) ^ S * M * 2 ^ E格式,如下图:


33995a8394b940409bdcbddb3d8a7327.png

IEEE 754 规定:

1)对于32位的浮点数,最高位的1位是符号位s,接着的8位是指数E,剩下的23位为有效数字M;

7f1af7f1315a4f3fb28e845ed1dbed63.png

2)对于64位的浮点数,最高位的1位是符号位s,接着的11位是指数E,剩下的52位为有效数字M;


IEEE 754 对有效数字 M 和指数 E ,还有一些特别规定。

前面说过, 1≤M<2 ,也就是说, M 可以写成 1.xxxxxx 的形式,其中 xxxxxx 表示小数部分。IEEE 754 规定,在计算机内部保存 M 时,默认这个数的第一位总是 1 ,因此可以被舍去,只保存后面的xxxxxx 部分。比如保存 1.01 的时候,只保存 01 ,等到读取的时候,再把第一位的 1 加上去。这样做的目的,是节省 1 位有效数字。以 32 位

浮点数为例,留给 M 只有 23 位,将第一位的 1 舍去以后,等于可以保存 24 位有效数字。


至于指数 E ,情况就比较复杂。


首先, E 为一个无符号整数( unsigned int )

这意味着,如果 E 为 8 位,它的取值范围为 0~255 ;如果 E 为 11 位,它的取值范围为 0~2047 。但是,我们知道,科学计数法中的 E 是可以出现负数的,所以 IEEE 754 规定,存入内存时 E 的真实值必须再加上一个中间数,对于 8 位的 E ,这个中间数是 127 ;对于 11 位的 E ,这个中间数是 1023 。比如, 2^10 的 E 是 10 ,所以保存成 32 位浮点数时,必须保存成 10+127=137 ,即10001001 。

然后,指数 E 从内存中取出还可以再分成三种情况:

E 不全为 0 或不全为 1

这时,浮点数就采用下面的规则表示,即指数 E 的计算值减去 127 (或 1023 ),得到真实值,再将有效数字 M 前加上第一位的 1 。

比如:

0.5 ( 1/2 )的二进制形式为 0.1 ,由于规定正数部分必须为 1 ,即将小数点右移 1 位,则为1.0*2^(-1) ,其阶码为 -1+127=126 ,表示为01111110 ,而尾数 1.0 去掉整数部分为 0 ,补齐 0 到 23 位 00000000000000000000000 ,则其二进制表示形式为 :

E 全为 0

这时,浮点数的指数 E 等于 1-127 (或者 1-1023 )即为真实值,

有效数字 M 不再加上第一位的 1 ,而是还原为 0.xxxxxx 的小数。这样做是为了表示 ±0 ,以及接近于

0 的很小的数字。

0 01111110 00000000000000000000000

E 全为 1

这时,如果有效数字 M 全为 0 ,表示 ± 无穷大(正负取决于符号位 s );

好了,关于浮点数的表示规则,就说到这里,对于上述问题,想必大家阅读了也是很抽象,接下来我们举个例子来看看:

1)以整形存进去,以浮点数打印:

2b640dd176c74c049f442922aed41fa9.png

这里为什么会打印出0呢?

7f1af7f1315a4f3fb28e845ed1dbed63.png

 2)以浮点数存进去,以整形打印:

1a7b7d5b649947c1bdd8830aef91f3b6.png

解释:

e470cf2152764b0c8705c0cd4a80116c.png

到这里关于浮点数的存储就讲完了,关于浮点数,我们知道就可,不必深究。

如果对上文有意见或者有错误,还请大佬们斧正,觉得有帮助的童鞋们,蟹蟹三连!

目录
相关文章
|
29天前
|
存储 编译器 数据处理
C 语言结构体与位域:高效数据组织与内存优化
C语言中的结构体与位域是实现高效数据组织和内存优化的重要工具。结构体允许将不同类型的数据组合成一个整体,而位域则进一步允许对结构体成员的位进行精细控制,以节省内存空间。两者结合使用,可在嵌入式系统等资源受限环境中发挥巨大作用。
57 11
|
2月前
|
监控 算法 应用服务中间件
“四两拨千斤” —— 1.2MB 数据如何吃掉 10GB 内存
一个特殊请求引发服务器内存用量暴涨进而导致进程 OOM 的惨案。
|
2月前
|
存储 C语言
数据在内存中的存储方式
本文介绍了计算机中整数和浮点数的存储方式,包括整数的原码、反码、补码,以及浮点数的IEEE754标准存储格式。同时,探讨了大小端字节序的概念及其判断方法,通过实例代码展示了这些概念的实际应用。
100 1
|
2月前
|
存储
共用体在内存中如何存储数据
共用体(Union)在内存中为所有成员分配同一段内存空间,大小等于最大成员所需的空间。这意味着所有成员共享同一块内存,但同一时间只能存储其中一个成员的数据,无法同时保存多个成员的值。
|
2月前
|
监控 Java easyexcel
面试官:POI大量数据读取内存溢出?如何解决?
【10月更文挑战第14天】 在处理大量数据时,使用Apache POI库读取Excel文件可能会导致内存溢出的问题。这是因为POI在读取Excel文件时,会将整个文档加载到内存中,如果文件过大,就会消耗大量内存。以下是一些解决这一问题的策略:
248 1
|
26天前
|
缓存 Prometheus 监控
Elasticsearch集群JVM调优设置合适的堆内存大小
Elasticsearch集群JVM调优设置合适的堆内存大小
208 1
|
15天前
|
存储 监控 算法
深入探索Java虚拟机(JVM)的内存管理机制
本文旨在为读者提供对Java虚拟机(JVM)内存管理机制的深入理解。通过详细解析JVM的内存结构、垃圾回收算法以及性能优化策略,本文不仅揭示了Java程序高效运行背后的原理,还为开发者提供了优化应用程序性能的实用技巧。不同于常规摘要仅概述文章大意,本文摘要将简要介绍JVM内存管理的关键点,为读者提供一个清晰的学习路线图。
|
24天前
|
Java
JVM内存参数
-Xmx[]:堆空间最大内存 -Xms[]:堆空间最小内存,一般设置成跟堆空间最大内存一样的 -Xmn[]:新生代的最大内存 -xx[use 垃圾回收器名称]:指定垃圾回收器 -xss:设置单个线程栈大小 一般设堆空间为最大可用物理地址的百分之80
|
25天前
|
Java
JVM运行时数据区(内存结构)
1)虚拟机栈:每次调用方法都会在虚拟机栈中产生一个栈帧,每个栈帧中都有方法的参数、局部变量、方法出口等信息,方法执行完毕后释放栈帧 (2)本地方法栈:为native修饰的本地方法提供的空间,在HotSpot中与虚拟机合二为一 (3)程序计数器:保存指令执行的地址,方便线程切回后能继续执行代码
19 3
|
26天前
|
存储 缓存 监控
Elasticsearch集群JVM调优堆外内存
Elasticsearch集群JVM调优堆外内存
45 1