深度剖析数据在内存中的存储(C语言)

简介: 计算机中对整型数据的存储采用二进制(注意计算机中数据都存为补码的形式)原码:将数值翻译成二进制就是原码反码:正数同原码,负数符号位不变,其他位取反,0变1,1变0补码:正数同原码,负数为其反码+1

#数据类型详细介绍


数据类型介绍

char          //字符型            // 1字节
short         //短整型            // 2字节 
int             //整型               // 3字节
long          //长整型            // 4字节或8字节    // C规定大于等于int
long long   //更长的整型     // 8字节
float          //单精度浮点型  // 4字节
double      //双精度浮点型   // 8字节

整型家族归类:

signed char         // char这里不能确定是有符号的,C语言没有明确规定
unsigned char
signed short        // 等同于short
unsigned short   
signed int            // 等同于int
unsigned int       
signed long         // 等同于long
unsigned long

浮点型家族归类:

float
double

构造类型:

结构体类型

枚举类型

共用体类型(联合类型)

自定义类型


指针类型:

int* pi
char* pc
long* pl
short* ps
float* pf
double* pd 

空类型:

void       //函数中 example:   void  reverse()
void*

#整型在内存中的存储

计算机中对整型数据的存储采用二进制(注意计算机中数据都存为补码的形式)

原码:将数值翻译成二进制就是原码

反码:正数同原码,负数符号位不变,其他位取反,0变1,1变0

补码:正数同原码,负数为其反码+1

对signed类型的数据来说有数值位和符号位一说,对于unsigned类型的数据来说只有数值位

符号位是在二进制的最高位上,short 2个字节,16个bit位,最左边那一位就是符号位,0为正,1为负,存储数据大小范围是 -32768 ~ 32767.那么为什么负数不是-32767呢?


int main()
{
  //  1的原码:00000000 00000000 00000000 00000001 
  //  short类型16个bit位,所以会发生数据的截断,从低位开始截断
  //  所以a中数据原码和补码为 00000000 00000001 
  short a = 1;
  //  1的原码:00000000 00000000 00000000 00000001
  //  1的补码:00000000 00000000 00000000 00000001
  // -1的反码:11111111 11111111 11111111 11111110
  // -1的补码:11111111 11111111 11111111 11111111
  //  b的原码:00000000 00000001
  //  b的补码:11111111 11111111
  short b = -1;
  //那么接下来就可以看一下-32768和32767了
  // 32767原码:01111111 11111111 只有十五个数值位,最左边一位是符号位
  // 32767补码:01111111 11111111
  //-32767原码:11111111 11111111 
  //-32767补码:10000000 00000001
  //那么-32768怎么来的呢?
  //发现了吗,是不是有一个补码没有用上?似乎没有值对应啊?
  //是的,补码10000000 00000000,所以C语言就给它规定了一个值,就是-32768
  //于是就有了short能存的数据大小范围,int,char,long也是同理的。
  return 0;
}

那么为什么计算机中,对正数和负数都存补码呢,其实是为了方便计算。

int main()
{
  int a = 1;
  int b = -1;
  //进行a+b的运算
  // 
  // 若存储原码:
  // a的原码:00000000  00000000  00000000  00000001
  // b的原码: 10000000  00000000  00000000  00000001
  //    a+b:10000000  00000000  00000000  00000010  
  //    结果为-2,当然不对了
  // 
  // a的补码 00000000  00000000  00000000  00000001
  // b的补码 11111111  11111111  11111111  11111111 
  //   a+b  00000000  00000000  00000000  00000000
  //   结果为0
  return 0;
}

#大小端字节序存储

大端字节序存储:数据的位(字节序的内容)存储在内存的地址处,而数据的位(字节序的内容)存储在内存的地址处。

小端字节序存储:数据的位(字节序的内容)存储在内存的地址处,而数据的位(字节序的内容)存储在内存的地址处。


废话不多说,上图:

7b71abb2767844629b09f38a1b91fe21.png

所以我所用的编译器是小端存储,低位的44存在了低地址处。


#浮点数在内存中的存储

先来一个引例;

#include <stdio.h>
int main()
{
  int n = 6;
  float* pf = (float*)&n;
  printf("%d\n", n);    // 6
  printf("%f\n", *pf);  // 0.000000
  *pf = 6.0;
  printf("%d\n", n);    // 1086324736
  printf("%f\n", *pf);  // 6.000000
  return 0;
}

为什么会这样?

这就是因为浮点数在内存中的存储方式和整数不同的原因,所以以不同的方式存储和和从内存中读取出来的数据是截然不同的。

在浮点数的存储方式中,首位是符号位,对float来说,接下来8位为指数位,剩下的23位为有效数字位,对double来说,11位指数位,剩下52位是有效数字位。

按照国际标准IEEE754任意一个浮点数可以表示成如下形式:

(-1)^0 * M * 2^E

(-1)^1 * M * 2^E

(-1)^0或1是符号位

M是有效数字位,用科学计数法表示,M大于等于1,小于2

2^E是指数位

举个例子:

9在计算机中以补码存储

00000000000000000000000000001001

1001可以表示为1.001 * 2^3

(-1)^0 * 1.001 * 2^3

所以以浮点数类型存储在计算机中的补码为

0 10000010 0010000000000000000000


IEEE754对指数E和M还有一些特殊的规定:

M存储时只存小数点后的数据,小数点前默认为1,且这个1不存,在读取数据的时候在前面加1,这样做的目的是节省一位有效数字,本身有效数字就只有23位,这么做就相当于可以存24位有效数字,提高了精度。

对于指数E,情况就稍微复杂一点

首先,E是一个无符号整数,unsigned int类型,如果是8位的话,他的取值范围就是0~255,如果是11位的话,取值范围为0~2047,但是科学计数法中的E是可以出现负数的,比如,

0.5     //  小数部分二进制表示为0.1                                        

表示为(-1)^0 * 1.0 * 2^(-1) E为-1

所以IEEE754规定,存入内存的E的真实值时,必须加上一个中间数,这个中间数就是127和1023,对应float和double。

像E为-1时就保存为126,即00111111 (float)

然后指数E从内存中取出还可以分成3种情况


一:不是全0也不是全1

这时候采用如下方式取E

用内存中存E的值减去127(1023)得到E的真实值,再将有效数字M加上前面的1

例如:

0.5在内存中存为0 00111111 00000000000000000000000

读取时23位0前加上1,就是1.0,E就是126-126=-1,这就是E的真实值,所以接下来计算

(-1)^0 * 1.0 * 2^(-1) = 0.5


二:全0

这时E的真实值为1-127或1-1023,并且在读取数据时,有有效数字前面不再加1,而是还原为0.xxxxxxxxx,这样做是为了表示+-0,以及接近于0的数字


三:全1

这时,E的真实值为255-127或2047-1023,表示一个非常大的数字,即+-无穷大


接下来就可以解释上述代码为什么会输出那样的结果了

int main()
{
  int n = 6;
  //按照整数的存储方式
  //00000000000000000000000000000110
  float* pf = (float*)&n;
  printf("%d\n", n);  //以整数形式读取数据
  printf("%f\n", *pf);//以浮点数形式读取数据 
  *pf = 6.0;
  //按照浮点数的存储方式
  //0 10000001 10000000000000000000000
  printf("%d\n", n);   //以整数形式读取数据
  printf("%f\n", *pf); //以浮点数形式读取数据
  return 0;
}

715dff6193fe4cada91670fb9b947843.png

完结撒花~

目录
打赏
0
0
0
0
6
分享
相关文章
C 语言中的数据类型转换:连接不同数据世界的桥梁
C语言中的数据类型转换是程序设计中不可或缺的一部分,它如同连接不同数据世界的桥梁,使得不同类型的变量之间能够互相传递和转换,确保了程序的灵活性与兼容性。通过强制类型转换或自动类型转换,C语言允许开发者在保证数据完整性的前提下,实现复杂的数据处理逻辑。
【C语言】内存布局大揭秘 ! -《堆、栈和你从未听说过的内存角落》
在C语言中,内存布局是程序运行时非常重要的概念。内存布局直接影响程序的性能、稳定性和安全性。理解C程序的内存布局,有助于编写更高效和可靠的代码。本文将详细介绍C程序的内存布局,包括代码段、数据段、堆、栈等部分,并提供相关的示例和应用。
47 5
【C语言】内存布局大揭秘 ! -《堆、栈和你从未听说过的内存角落》
C 语言中的文件操作:数据持久化的关键桥梁
C语言中的文件操作是实现数据持久化的重要手段,通过 fopen、fclose、fread、fwrite 等函数,可以实现对文件的创建、读写和关闭,构建程序与外部数据存储之间的桥梁。
C 语言在计算机科学中尤其在硬件交互方面占据重要地位。本文探讨了 C 语言与硬件交互的主要方法,包括直接访问硬件寄存器、中断处理、I/O 端口操作、内存映射 I/O 和设备驱动程序开发
C 语言在计算机科学中尤其在硬件交互方面占据重要地位。本文探讨了 C 语言与硬件交互的主要方法,包括直接访问硬件寄存器、中断处理、I/O 端口操作、内存映射 I/O 和设备驱动程序开发,以及面临的挑战和未来趋势,旨在帮助读者深入了解并掌握这些关键技术。
54 6
C语言如何使用结构体和指针来操作动态分配的内存
在C语言中,通过定义结构体并使用指向该结构体的指针,可以对动态分配的内存进行操作。首先利用 `malloc` 或 `calloc` 分配内存,然后通过指针访问和修改结构体成员,最后用 `free` 释放内存,实现资源的有效管理。
155 13
C 语言结构体 —— 数据封装的利器
C语言结构体是一种用户自定义的数据类型,用于将不同类型的数据组合在一起,形成一个整体。它支持数据封装,便于管理和传递复杂数据,是程序设计中的重要工具。
C 语言结构体与位域:高效数据组织与内存优化
C语言中的结构体与位域是实现高效数据组织和内存优化的重要工具。结构体允许将不同类型的数据组合成一个整体,而位域则进一步允许对结构体成员的位进行精细控制,以节省内存空间。两者结合使用,可在嵌入式系统等资源受限环境中发挥巨大作用。
70 11
C 语言指针与内存管理
C语言中的指针与内存管理是编程的核心概念。指针用于存储变量的内存地址,实现数据的间接访问和操作;内存管理涉及动态分配(如malloc、free函数)和释放内存,确保程序高效运行并避免内存泄漏。掌握这两者对于编写高质量的C语言程序至关重要。
63 11
C 语言指针详解 —— 内存操控的魔法棒
《C 语言指针详解》深入浅出地讲解了指针的概念、使用方法及其在内存操作中的重要作用,被誉为程序员手中的“内存操控魔法棒”。本书适合C语言初学者及希望深化理解指针机制的开发者阅读。
C语言因高效灵活被广泛应用于软件开发。本文探讨了优化C语言程序性能的策略,涵盖算法优化、代码结构优化、内存管理优化、编译器优化、数据结构优化、并行计算优化及性能测试与分析七个方面
C语言因高效灵活被广泛应用于软件开发。本文探讨了优化C语言程序性能的策略,涵盖算法优化、代码结构优化、内存管理优化、编译器优化、数据结构优化、并行计算优化及性能测试与分析七个方面,旨在通过综合策略提升程序性能,满足实际需求。
65 1
AI助理

你好,我是AI助理

可以解答问题、推荐解决方案等