🚀前言
大家好啊😉!今天阿辉将为大家介绍C语言中整型和浮点型在内存中的存储的,✍包括进制转换,原码,反码,补码以及大小端,接下来还会介绍关于原反补码的相关例题关注阿辉不迷路哦 😘 ,内容干货满满😋,接下来就跟着阿辉一起学习吧👊
🚀数据类型
- 整型
char unsigned char——无符号 signed char——有符号 short unsigned short [int] signed short [int] int unsigned int signed int long unsigned long [int] signed long [int] long long
大家可能会疑惑
char
不是字符类型吗?因为字符在内存是以
ASCII值
存储的所以也可以划分到整型
- 浮点型
float 单精度浮点型 double 双精度浮点型
- 构造类型
数组类型 结构体类型 struct 枚举类型 enum 联合类型 union
- 指针类型
int * ip; char * cp; float * fp; void * vp;
空类型:void 表示空类型(无类型)通常应用于函数的返回类型、函数的参数、指针类型
数据的类型决定了内存为所存数据开辟空间的大小,以及数据是如何存进内存中又是如何从内存中取出的
给一个类型比如int
和float
我们知道它俩都在内存中占4个字节
那它俩创建的变量的数据在所开辟内存中到底是如何存储的
🚀整型在内存中的存储
✈️进制的转换
C语言规定表示八进制数要前面加个数字0
,表示十六进制数要在前面加0x
而十进制数什么都不用加就表示十进制数
十进制转二进制:
二进制转八进制:
8进制的数字每⼀位是0 ~ 7,0~7的数字,各自写成2进制,最多有3个2进制位就足够了,比如7的二进制是111,所以在2进制转8进制数的时候,从2进制序列中右边低位开始向左每3个2进制位会换算一个8进制位,剩余不够3个2进制位的直接换算
🌰栗子
2进制的01101011,换成8进制:0153,0开头的数字,会被当做8进制
二进制转十六进制:
16进制的数字每⼀位是0~ 9,a ~ f 的,0~9,a ~f的数字,各自写成2进制,最多有4个2进制位就足够了,比如 f 的二进制是1111,所以在2进制转16进制数的时候,从2进制序列中右边低位开始向左每4个2进制位会换算⼀个16进制位,剩余不够4个二进制位的直接换算。
十六进制中10~15用
a,b,c,d,e,f
表示
🌰栗子
2进制的01101011,换成16进制:0x6b,16进制表示的时候前⾯加0x
整形在内存中都是以补码的形式来存储的,什么补码是什么?
我们接着看👇
✈️原码、反码和补码
符号位就是二进制数的最高位,符号位为1
该数为负数,为0
该数为正数
正数的原反补码相同
而负数的原反补码需要按以下方式计算:
- 原码
直接将数值按照正负数的形式翻译成二进制就可以得到原码 - 反码
将原码的符号位不变,其他位依次按位取反就可以得到反码 - 补码
反码+1就得到补码
由补码得到原码同样可以将补码的符号位不变,其他位依次按位取反就可以然后
+1
就得到原码
这里我们以整型中最常见的int
为例,为大家介绍整型在内存中是如何存储的
int
占4个字节也就是32个比特位
🌰栗子
int a = 20; 0000 0000 0000 0000 0000 0000 0001 0100 -> 原码 0000 0000 0000 0000 0000 0000 0001 0100 -> 反码 0000 0000 0000 0000 0000 0000 0001 0100 -> 补码 0x 00 00 00 14 -> 20的补码十六进制表示 int b = -10; 1000 0000 0000 0000 0000 0000 0000 1010 ->原码 1111 1111 1111 1111 1111 1111 1111 0101 ->反码//原码符号位不变,其他位按位取反 1111 1111 1111 1111 1111 1111 1111 0110 ->补码//反码+1 0xff ff ff ff f6 -> -1的补码十六进制表示
整型是以二进制形式在内存中存储,但是二进制数太长不好展示,在vs2022环境中调试内存是以十六进制来展示的(以下图片均来自vs2022x86环境下调试结果)
对于正数的存储我们并不能得到内存是以补码来存储整型,我们来看看负数
通过上面的演示我们知道整型在内存中是以二进制形式的补码来存储的,这是为什么呢?
原因在于,使⽤补码,可以将符号位和数值域统⼀处理;
同时,加法和减法也可以统⼀处理(CPU只有加法器)此外,补码与原码相互转换,其运算过程是
相同的,不需要额外的硬件电路
但是你们有没有发现在内存中这些数字是倒着存的
这是为什么呢?我们接着往下↓看
🚀大小端字节序
我们了解了整型在内存中的存储,但是呢却是倒着存的,我们来看看👇
🌰栗子
#include <stdio.h> int main() { int a = 0x11223344; 十六进制数便于观察 return 0; }
这就得提一个重要的概念就是大小端👊
什么是大小端?
其实超过一个字节的数据在内存中存储的时候,就有存储顺序的问题,按照不同的存储顺序,我们分为大端字节序存储和小端字节序存储,下面是具体的概念:
什么是字节序呢,就是以字节为单位进行排序,每个字节为一个整体
大端(存储)模式:是指数据的低位字节内容保存在内存的高地址处,而数据的高位位字节内容,保存在内存的低地址处。
小端(存储)模式:是指数据的低位字节内容保存在内存的低地址处,而数据的高位字节内容,保存在内存的高地址处
从上图我们可以知道vs2022为小端模式
为什么会有大小端呢?
这是因为在计算机系统中,我们是以字节为单位的,每个地址单元都对应着⼀个字节,⼀个字节为8bit 位,但是在C语⾔中除了8 bit 的 char 之外,还有16 bit 的 short 型,32 bit 的 long 型(要看具体的编译器),另外,对于位数大于8位的处理器,例如16位或者32位的处理器,由于寄存器宽度大于一个字节,那么必然存在着⼀个如何将多个字节安排的问题。因此就导致了大端存储模式和小端存储模式
那么如何利用一个简单的代码来判断当前机器是什么字节序呢,我们接着看👇
#include <stdio.h> int check_sys()//封装一个函数判断当前机器为何种模式 { int i = 1; 数字1为int类型有4个字节补码为 0000 0000 0000 0000 0000 0000 0000 0001 如果是小端模式它的低地址第一个字节是0000 0001 如果是大端模式它的低地址第一个字节是0000 0000 return (*(char *)&i); 而将&i强制转化为char*类型后,对&i解引用操作仅能访问一个字节 如果是小端模式那返回值就是1 如果是大端模式那返回值就是0 } int main() { int ret = check_sys(); if(ret == 1) { printf("⼩端\n"); } else { printf("⼤端\n"); } return 0; }
上述我通过int
类型来介绍了大小端,但并非只有int
类型要用大小端字节序来存储,只要是空间大于一个字节都会用大小端字节序来存储包括整型以及浮点型
🚀浮点型在内存中的存储
浮点型包括float
double
long double
,那么浮点型又是如何存储的呢,是否与整型相同呢?我们接着看👇
✈️浮点型的存储规则
根据国际标准IEEE(电气和电子工程协会) 754,任意一个二进制浮点数V可以表示成下面的形式:
- ( − 1 ) S ∗ M ∗ 2 E (-1)^{S}*M*2^{E}(−1)S∗M∗2E
- ( − 1 ) S (-1)^{S}(−1)S表示符号位,S为1表示负数,S为0表示正数
- M MM表示有效数字,M MM的值大于等于1,小于2
- 2 E 2^{E}2E表示指数位
有点懵,没关系我举个🌰栗子
比如一个浮点数 5.0f 5.0用二进制表示就是101.0 而101.0 = (-1)^0 * 1.01 * 2^2//这里(-1)^0表示-1的0次方,*表示乘号 而S = 0,M = 1.01,E = 2 而 -5.0f 就可以表示为(-1)^1 * 1.01 * 2^2 S = 1,M = 1.01,E = 2
IEEE 754规定:
对于32位的浮点数也就是float
类型,最高的1位是符号位S,接着的8位是指数E,剩下的23位为有效数字M
对于64位的浮点数,最高的1位是符号位S,接着的11位是指数E,剩下的52位为有效数字M
IEEE 754对有效数字M和指数E,还有一些特别规定。
前面说过, 1≤M<2 ,也就是说,M可以写成 1.xxxxxx 的形式,其中xxxxxx表示小数部分。
IEEE 754规定,在计算机内部保存M时,默认这个数的第一位总是1,因此可以被舍去,只保存后面的xxxxxx部分。比如保存1.11的时候,只保存11,等到读取的时候,再把第一位的1加上去。这样做的目的,是节省1位有效数字。以32位浮点数为例,留给M只有23位,将第一位的1舍去以后,等于可以保存24位有效数字。
至于指数E,情况就比较复杂。首先,E为一个无符号整数(unsigned int)
这意味着,如果E为8位,它的取值范围为0 ~ 255;如果E为11位,它的取值范围为0 ~2047。但是,我们知道,科学计数法中的E是可以出现负数的,所以IEEE 754规定,存入内存时E的真实值必须再加上一个中间数,对于8位的E,这个中间数是127;对于11位的E,这个中间
数是1023。比如,2^10的E是10,所以保存成32位浮点数时,必须保存成10+127=137,即10001001
🌰栗子
float f = 5.5f; 它的二进制表示101.1//0.5是2的-1次方 也等于(-1)^0 * 1.011 * 2^2 其中S = 0,M = 1.011,E = 2 + 127 = 129 129的二进制表示10000001
但是存在一些浮点数是无法表示出来的。小数点后面的数无法完整地表示出来,可能总是差一点点。可能会出现精度的缺失
以上我们了解了浮点数是如何存入内存中的,那我们如何取出来呢?我们接着看👇
✈️浮点数的读取规则
这里分为三种情况:
- E中有1有0时:
这时,浮点数就遵循以下规则:
指数E的存储值减去127(或1023),有效值M前补数字1
🌰栗子
- E中全为0时:
这时,浮点数的指数E等于1-127(或者1-1023)即为真实值,有效数字M不再加上第一位的1,而是还原为0.xxxxxx的小数。这样做是为了表示±0,以及接近于0的很小的数字 - E中全为1时
这时,如果有效数字M全为0,表示±无穷大(正负取决于符号位s)
到这里,阿辉今天对于C语言中整型以及浮点型在内存中的存储的分享就结束了,希望这篇博客能让大家有所收获, 如果觉得阿辉写得不错的话,记得给个赞呗,你们的支持是我创作的最大动力🌹