『C语言进阶』数据在内存中的存储规则

简介: 『C语言进阶』数据在内存中的存储规则

前些天发现了一个巨牛的人工智能学习网站,通俗易懂,风趣幽默,忍不住分享一下给大家。点击跳转到网站

前言

小羊近期已经将C语言初阶学习内容与铁汁们分享完成,接下来小羊会继续追更C语言进阶相关知识,小伙伴们坐好板凳,拿起笔开始上课啦~


一、数据类型的介绍

我们目前已经学了基本的内置类型:

char       //字符数据类型
short      //短整型
int        //整形
long       //长整型
long long  //更长的整形
float      //单精度浮点数
double     //双精度浮点数

类型的基本归类

  1. 整形家族:
char:
   unsigned char
   signed char
short:
   unsigned short[int]
   signed short[int]
int:
   unsigned int
   signed int
long:
   unsigned long[int]
   signed long[int]

unsigned:无符号数类型

当一个数是无符号类型时,那么其最高位的1或0,和其它位一样,用来表示该数的大小。

signed:有符号数类型

当一个数是有符号类型时,最高数称为“符号位”。符号位为1时,表示该数为负数,为0时表示为正数。

注意:有符号类型可以表示正数,负数或0,无符号类型仅能表示大于等于0的值

  1. 浮点型家族:
float
double
  1. 构造类型:
//数组类型
struct //结构体类型
enum   //枚举类型
union //联合类型
  1. 指针类型:
int* p;
char* p;
float* p;
void* p;
  1. 空类型:
void//(空类型)

二、整型在内存中的存储

以整型int为例,我们都知道常见的编译器中int占四个字节,那么计算机中这四个字节是如何将数据存储下来的呢?

那我们先了解一下机器数和真值的概念,再去了解原码,反码,补码的概念

2.1 机器数

一个数在计算机中的二进制表示形式,叫做这个数的机器数。机器数是带符号的,在计算机中 用机器数的最高位存放符号,正数为0,负数为1。

例如:

+ 3的机器数:0000 0011
- 3的机器数:1000 0011

2.2 真值

因为第一位是符号位,所以机器数的形式值就不等于真正的数值。所以,为区别起见,将带符号位的机器数对应的真正数值称为机器数的真值。

例如:

0000 0001的真值 = +000 0001 = +1
1000 0001的真值 = -000 0001 = -1

2.3 原码、反码、补码

对于一个数,计算机要使用一定的编码方式进行存储,原码、反码、补码是机器存储一个具体数字的编码方式。

三种方式均有符号位和数值位两部分,符号位都是0表示“正数”,1表示“负数”,而数值位分正负数而定。

正数的原码、反码、补码都相同,负数的原码、反码、补码各不相同

原码:

直接将数值按照正负数的形式翻译成二进制就可以得到原码

反码:

将原码的符号位不变,其他位次按位取反

补码:

反码符号位不变,数值为+1

反码回到原码的两种方式:

1、补码-1后 取反得到原码

2、补码取反后 +1得到原码

对于整形来说:数据存放内存中其实存放的是补码,那这又是为什么呢?

在计算机系统中,数值一律用补码来表示和存储。原因在于,使用补码,可以将符号位和数

值域统一处理;同时,加法和减法也可以统一处理(CPU只有加法器 )此外,补码与原码相

互转换,其运算过程是相同的,不需要额外的硬件电路。

我们看看在内存中的存储:

我们知道内存中a和b存储的是补码,但我们发现存储的顺序有点不对劲。

-10在内存中存储应该是FFFFFFF6,而我们看到的是F6FFFFFF。

这里小羊呢,就为铁汁们了解一下大小端

2.4 大小端介绍

什么是大小端:

大端存储模式:指数据的低位保存在内存的高地址中,而数据的高位保存在内存的低地址中

小端存储模式:指数据的低位保存在内存的低地址中,而数据的高位保存在内存的高地址中

例如:

数字0x12 34 56 78在内存中:

大端模式:(我们通常直观上认为的模式)

低地址 --------------------> 高地址
         0x12  |  0x34  |  0x56  |  0x78

小端模式:

低地址 --------------------> 高地址
         0x78  |  0x56  |  0x34  |  0x12

** 为什么会有大端和小端呢?**

因为在计算机系统中,我们是以字节为单位的,每个地址单元都对应着一个字节,一个字节为8bit。但是在C语言中除了8 bit的char之外,还有16 bit的short型,32 bit的long型(要看具体的编译器),另外,对于位数大于8位的处理器,例如16位或者32位的处理器,由于寄存器宽度大于一个字节,那么必然存在着一个如何将多个字节安排的问题。因此就导致了大端存储模式和小端存储模式。

如何判断大小端的代码:

#include<stdio.h>
int main()
{
  int i = 1;//0000 0001
  char* p = &i;
  if (*p == 1)//若第一个地址存的是1,即为小端,反则大端
    printf("小端");
  else
    printf("大端";
  return 0;
}

自定义函数测试:

#include<stdio.h>
int check_sys()
{
  int a = 1;
  char* p = (char*)&a;
  if (*p == 1)
    return 1;
  else
    return 0;
}
int main()
{
  if (check_sys() == 1)
    printf("小端");
  else
    printf("大端");
  return 0;
}

三、浮点数在内存中的存储

#include<stdio.h>
int main()
{
  int n = 9;
  float* p = (float*)&n;
  printf("n的值为:%d\n", n);
  printf("*p的值为:%f\n", *p);
  *p = 9.0;
  printf("n的值为:%d\n", n);
  printf("*p的值为:%f\n", *p);
  return 0;
}

我们先试着猜一下结果

输出显示:

怎么样,这个结果是不是有点出乎意料!那么就跟着小羊来学习浮点数的存储规则吧。

3.1浮点数存储规则

浮点数存储形式:

根据国际标准IEEE(电子和电子工程协会)754,任意一个二进制浮点数V可以表示为下面的形式:

(-1) ^ S * M * 2 ^ E


 1.  (-1) ^ S 表示符号位,当S=0时,V为正数;当S=1时,V为负数

 2.  M 表示有效数字,且1 <= M <2

 3.  2 ^ E表示指数位

例如:

  1. 十进制的5.0,写成二进制是0101 ------> 1.10x2^2
    可以得出s=0,M=1.01,E=2
  2. 十进制的-7.0,写成二进制是0111 ------->1.11x2^2
    可以得出s=-1,M=1.11,E=2

IEEE 754 规定:

对于 32 位的浮点数(单精度),最高的 1 位是符号位 s ,接着的 8 位是指数 E ,剩下的 23位为有效数字 M 。

对于 64 位的浮点数(双精度),最高的 1 位是符号位S,接着的 11 位是指数 E ,剩下的 52 位为有效数字 M 。

IEEE 754 对有效数字** M **和指数 E ,还有一些特别规定。

前面说过, 1≤M<2 ,也就是说, M 可以写成 1.xxxxxx 的形式,其中 xxxxxx 表示小数部分。

IEEE 754 规定,在计算机内部保存 M 时,默认这个数的第一位总是 1 ,因此可以被舍去,只保存后面的xxxxxx部分。比如保存 1.01 的时候,只保存01 ,等到读取的时候,再把第一位的 1 加上去。这样做的目的,是节省 1 位有效数字。以 32 位浮点数为例,留给M 只有 23 位,将第一位的1 舍去后等于可以保存 24 位有效数字。

至于指数 E ,情况就比较复杂。首先, E 为一个无符号整数( unsigned int )

这意味着,如果 E 为 8 位,它的取值范围为 0~255 ;如果 E 为 11 位,它的取值范围为 0~2047 。但是我们知道,科学计数法中的E 是可以出现负数的,所以IEEE 754 规定,存入内存时 E 的真实值必须再加上一个中间数,对于 8 位的 E ,这个中间数是127 ;对于 11 位的 E ,这个中间数是1023 。比如 2^10的 E 是 10 ,所以保存成 32 位浮点数时,必须保存成 10+127=137 ,即10001001。

3.2 浮点型的读取

我们知道浮点型在内存中的存储后,将步骤反过来就是取出的过程。

1、有效数字M:

IEEE 754规定,在计算机内部保存M时,默认这个数的第一位总是1,因此可以被舍去,只保存小数部分。比如保存1.0110001101时,只保存0110001101,后面的位数补0就可以了,等到读取的时候,再把第一位的1补上去。

2、指数E

E为一个无符号整数(unsigned int)根据指数域不同取值分为一下三种情况:

1)E不全为0或不全为1(规格化值)

这是最常见情况,取出内存中的数时,指数E的计算值减去127(或1023),得到真实值,再将有效数字M前加上第一位的1。

2)E全为0(非规格化值)

这时,浮点数的指数E等于1-127(或1-1023)即为真实值,有效数字M不再加上第一位的1,而是还原为0.xxxxxxx的小数。这样做是为了表示正负零,以及接近于0的很小的数字。

3)E全为1(特殊数值)

当指数域全为1时属于这种情形。此时,如果小数域全为0且符号域S=0,则表示正无穷,如果小数域全为0且符号域S=1,则表示负无穷。如果小数域不全为0时,浮点数将被解释为NaN, 即不是一个数(Not a Number)

解释前面的题目:

整形9以浮点型打印
整形存储,浮点型打印
0000  0000 0000 0000 0000 0000 0000 1001
浮点型读取:
s=0,M=000 0000 0000 0000 0000 0110,E=0000 0000(E全为0)
所以结果为:0.0000(近于0的很小的数字)
现在看例题的第二部:
浮点数9.0以整形打印
9.0 -> 1001.0 -> (-1)^0*1.001*2^3 -> s=0,M=1.001,E=,3+127=130
所以第一位的符号位s=0,有效数字M为001后面在加20个0,凑满23位,指数E为3+127=130,即10000010
所以写成S+E+M:
0 10000010 001 0000 0000 0000 0000 0000
这32位的二进制数,还原成十进制,正是1091567616

总结

希望看完这篇文章对铁汁们有所帮助,小羊后续还会持续更新C语言的学习知识,希望小伙伴们给个支持,来个一键三连~

目录
打赏
0
0
0
0
0
分享
相关文章
kafka 的数据是放在磁盘上还是内存上,为什么速度会快?
Kafka的数据存储机制通过将数据同时写入磁盘和内存,确保高吞吐量与持久性。其日志文件按主题和分区组织,使用预写日志(WAL)保证数据持久性,并借助操作系统的页缓存加速读取。Kafka采用顺序I/O、零拷贝技术和批量处理优化性能,支持分区分段以实现并行处理。示例代码展示了如何使用KafkaProducer发送消息。
C 语言结构体与位域:高效数据组织与内存优化
C语言中的结构体与位域是实现高效数据组织和内存优化的重要工具。结构体允许将不同类型的数据组合成一个整体,而位域则进一步允许对结构体成员的位进行精细控制,以节省内存空间。两者结合使用,可在嵌入式系统等资源受限环境中发挥巨大作用。
116 11
“四两拨千斤” —— 1.2MB 数据如何吃掉 10GB 内存
一个特殊请求引发服务器内存用量暴涨进而导致进程 OOM 的惨案。
120 14
C语言:结构体对齐规则
C语言中,结构体对齐规则是指编译器为了提高数据访问效率,会根据成员变量的类型对结构体中的成员进行内存对齐。通常遵循编译器默认的对齐方式或使用特定的对齐指令来优化结构体布局,以减少内存浪费并提升性能。
数据在内存中的存储方式
本文介绍了计算机中整数和浮点数的存储方式,包括整数的原码、反码、补码,以及浮点数的IEEE754标准存储格式。同时,探讨了大小端字节序的概念及其判断方法,通过实例代码展示了这些概念的实际应用。
242 1
【C语言程序设计——函数】素数判定(头歌实践教学平台习题)【合集】
本内容介绍了编写一个判断素数的子函数的任务,涵盖循环控制与跳转语句、算术运算符(%)、以及素数的概念。任务要求在主函数中输入整数并输出是否为素数的信息。相关知识包括 `for` 和 `while` 循环、`break` 和 `continue` 语句、取余运算符 `%` 的使用及素数定义、分布规律和应用场景。编程要求根据提示补充代码,测试说明提供了输入输出示例,最后给出通关代码和测试结果。 任务核心:编写判断素数的子函数并在主函数中调用,涉及循环结构和条件判断。
64 23
|
1月前
|
【C语言程序设计——函数】利用函数求解最大公约数和最小公倍数(头歌实践教学平台习题)【合集】
本文档介绍了如何编写两个子函数,分别求任意两个整数的最大公约数和最小公倍数。内容涵盖循环控制与跳转语句的使用、最大公约数的求法(包括辗转相除法和更相减损术),以及基于最大公约数求最小公倍数的方法。通过示例代码和测试说明,帮助读者理解和实现相关算法。最终提供了完整的通关代码及测试结果,确保编程任务的成功完成。
70 15
|
1月前
|
【C语言程序设计——函数】亲密数判定(头歌实践教学平台习题)【合集】
本文介绍了通过编程实现打印3000以内的全部亲密数的任务。主要内容包括: 1. **任务描述**:实现函数打印3000以内的全部亲密数。 2. **相关知识**: - 循环控制和跳转语句(for、while循环,break、continue语句)的使用。 - 亲密数的概念及历史背景。 - 判断亲密数的方法:计算数A的因子和存于B,再计算B的因子和存于sum,最后比较sum与A是否相等。 3. **编程要求**:根据提示在指定区域内补充代码。 4. **测试说明**:平台对代码进行测试,预期输出如220和284是一组亲密数。 5. **通关代码**:提供了完整的C语言代码实现
61 24
|
1月前
|
【C语言程序设计——函数】递归求斐波那契数列的前n项(头歌实践教学平台习题)【合集】
本关任务是编写递归函数求斐波那契数列的前n项。主要内容包括: 1. **递归的概念**:递归是一种函数直接或间接调用自身的编程技巧,通过“俄罗斯套娃”的方式解决问题。 2. **边界条件的确定**:边界条件是递归停止的条件,确保递归不会无限进行。例如,计算阶乘时,当n为0或1时返回1。 3. **循环控制与跳转语句**:介绍`for`、`while`循环及`break`、`continue`语句的使用方法。 编程要求是在右侧编辑器Begin--End之间补充代码,测试输入分别为3和5,预期输出为斐波那契数列的前几项。通关代码已给出,需确保正确实现递归逻辑并处理好边界条件,以避免栈溢出或结果
68 16
【C语言程序设计——函数】分数数列求和2(头歌实践教学平台习题)【合集】
函数首部:按照 C 语言语法,函数的定义首部表明这是一个自定义函数,函数名为fun,它接收一个整型参数n,用于指定要求阶乘的那个数,并且函数的返回值类型为float(在实际中如果阶乘结果数值较大,用float可能会有精度损失,也可以考虑使用double等更合适的数据类型,这里以float为例)。例如:// 函数体代码将放在这里函数体内部变量定义:在函数体中,首先需要定义一些变量来辅助完成阶乘的计算。比如需要定义一个变量(通常为float或double类型,这里假设用float。
38 3

热门文章

最新文章