C语言,数据在内存中的存储。——保姆级教学

简介: C语言,数据在内存中的存储。——保姆级教学

序言:

学了很久的C语言,直到C语言有很多的数据类型,但是你知道他们在内存中是怎么存储的吗?今天小编就带大家一起来,深入学习一下,数据在内存中是怎么存储的。今天主要介绍整型。关于浮点型,我们后面单独拿出来讲。


一.类型

一说到整形,大家肯定立马就想到了,int ,  short,  long,  long long,但是其实char也是整形大家族的一员。哎,有的小伙伴就有疑惑了,char 不是字符型吗,怎么成整形了?大家想一想,char在存储一个字符的时候,存储的还是字符的ASCII值,实际上还是存储的0~127之间的整数。存储的模式还是和int  short 一样,不一样的是,他们的大小不一样。



二.二进制的表示形式

我们知道 int 在内存中占有四个字节,32位,但是你知不知道,是怎么存储的吗?


有的小伙伴了解过可能知道,存储的是二进制。二进制直接存进去吗?不是的。


二进制也有自己形式,分别是,源码,反码,补码。计算机在内存中存的就是二进制的补码。


我们接下来就来讨论一下,一个整形数据二进制的,源码,反码,补码。


我们二进制都是 0 1组成的,那么源码,反码,补码也不例外了,三种表示方法均有符号位和数值位两部分,符号位都是用0表示“正”,用1表示“负”。


(1)正数的源码,反码,补码

        正数的原码、反码、补码都相同。源码就是,整形数据直接转换的二进制。

  例如:

    int a = 10;
  //二进制
  00000000000000000000000000001010;  "源码", "反码","补码";
  "首位 0 ,代表二进制数,是个正数";

(2)负数的源码,反码,补码

负数的源码:符号位是 1,其他未按照正数一样转换成二进制。

负数的反码:其源码的符号位不表,其他位按位取反,就是反码了。

负数的补码:在反码的基础上,加一。

例如:

    int b = -10;
  "二进制";"首位 1 ,代表二进制数是负数"
  10000000000000000000000000001010;  "源码"
  11111111111111111111111111110101;  "反码"
  11111111111111111111111111110110;  "补码"

如果需要用补码求源码,也很简单,补码减一,得到反码,反码再按位取反,就得到了源码。


(3)无符号数

我们知道还有一些数是无符号数。对于无符号数就是,首位符号位也看做是数值有效位。


那为什么计算机的存储整形数据的时候,为什么要用补码来存储吗?


原因在于,使用补码,可以将符号位和数值域统一处理;同时,加法和减法也可以统一处理(CPU只有加法器)此外,补码与原码相互转换,其运算过程是相同的,不需要额外的硬件电路。


三.大小端介绍

我们知道整形数据再内存中是以补码的形式存储的,我们来看一看到底是不是这么回事。


ce2df8774e514791a1927af565a8e1d8.png


好像是补码,又不完全是,ff ff ff f6,但是显示的是 f6 ff ff ff,好像是倒过来的,但是又不完全是。 其实是倒过来的,只不过是两个十六进制数,一个十六进制数,占4个比特位,两个就占8个比特位,也就是一个字节,而字节又是内存的最小单元,所以两个十六进制数在一起的是没法分开的。所以ff ff ff ff 反过来就是,f6 ff ff ff 。


那么问题来了,为什么会反过来存储呢?


这就是因为存在大小端的问题。为什么会有大小端模式之分呢?这是因为在计算机系统中,我们是以字节为单位的,每个地址单元都对应着一个字节,一个字节为8 bit。但是在C语言中除了8 bit的char之外,还有16 bit的short型,32 bit的long型(要看具体的编译器),另外,对于位数大于8位的处理器,例如16位或者32位的处理器,由于寄存器宽度大于一个字节,那么必然存在着一个如何将多个字节安排的问题。因此就导致了大端存储模式和小端存储模式。


简单来说就是大小端就是俩种,不同的字节序存储方式:


大端(存储)模式:是指数据的低位保存在内存的高地址中,而数据的高位,保存在内存的低地址

中;

小端(存储)模式:是指数据的低位保存在内存的低地址中,而数据的高位,,保存在内存的高地

址中。


例如:一个 16bit 的 short 型 x ,在内存中的地址为 0x0010 , x 的值为 0x1122 ,那么 0x11 为

高字节, 0x22 为低字节。对于大端模式,就将 0x11 放在低地址中,即 0x0010 中, 0x22 放在高

地址中,即 0x0011 中。小端模式,刚好相反。我们常用的 X86 结构是小端模式,而 KEIL C51 则

为大端模式。很多的ARM,DSP都为小端模式。有些ARM处理器还可以由硬件来选择是大端模式

还是小端模式。


(1)小端存储图例:


2dd347b7d5b942e8b114da9bbae88afe.png


(2)大端存储图例:


d00de6302f3b48b09100aba219fa024b.png


四.大小端字节序的判断

那我们怎么设计程序来判断当前的机器是大端存储还是小端存储呢?


我们知道计算机在往外拿数据的时候,是从低地址往高地址拿取的。那我们只要拿出数据的第一个字节的数据,看看它是高位数据,还是低位数据,就可以判断是大端存储还是小端存储了。

代码:

#include<stdio.h>
int main()
{
  int a = 0x00000001;
  //将数据地址强转为(char*),意味着当解引用访问时,
  //因为char只有一个字节,所以char*解引用访问时,只会
  //访问a的空间的一个字节。
  char* ch = (char*) & a;
  if (*ch == 1)
  {
    printf("小端存储\n");
  }
  else
  {
    printf("大端存储\n");
  }
  return 0;
}


五.整形提升,截断,整形数据的范围

(1)什么是整形提升?

C的整型算术运算总是至少以缺省整型类型的精度来进行的。为了获得这个精度,表达式中的字符和短整型操作数在使用之前被转换为普通整型,这种转换称为整型提升。


(2)整形提升又有什么意义呢?

表达式的整型运算要在CPU的相应运算器件内执行,CPU内整型运算器(ALU)的操作数的字节长度

一般就是int的字节长度,同时也是CPU的通用寄存器的长度。因此,即使两个char类型的相加,在CPU执行时实际上也要先转换为CPU内整型操作数的标准长度。


通用CPU(general-purpose CPU)是难以直接实现两个8比特字节直接相加运算(虽然机器指令中可能有这种字节相加指令)。所以,表达式中各种长度可能小于int长度的整型值,都必须先转换为int或unsigned int,然后才能送入CPU去执行运算。


(3)如何进行整体提升呢?

 整形提升是按照变量的数据类型的符号位来提升的

//负数的整形提升
char c1 = -1;
变量c1的二进制位(补码)中只有8个比特位:
1111111
因为 char 为有符号的 char
所以整形提升的时候,高位补充符号位,即为1
提升之后的结果是:
11111111111111111111111111111111
//正数的整形提升
char c2 = 1;
变量c2的二进制位(补码)中只有8个比特位:
00000001
因为 char 为有符号的 char
所以整形提升的时候,高位补充符号位,即为0
提升之后的结果是:
00000000000000000000000000000001

(4) 截断:将较大数据类型赋值给小的数据类型,就会发生。

截断规则:只需从大的数据类型最低位开始取够小的数据类型的位数,给小的数据类型就可以了

int main()
{
  char a = 4;
//  00000100  补码
//  00000000000000000000000000000100   整形提升后
  char b = -1;
//  11111111  补码
//  11111111111111111111111111111111   整形提升后
  char c = a + b;
//  00000000000000000000000000000100 -  4    补码
//  11111111111111111111111111111111 -  -1   补码
// 100000000000000000000000000000011 -  3    最高位符号位为0,正数源,反,补码相同
//  00000011  ---c    因为 c 是 char类型,所以只需要发生截断,取后8位。
//  %d 是打印有符号整形 仍需要整形提升后打印。
  printf("%d ", c);
  return 0;
}

(5)整形提升的实例

实例1:

int main()
{
  char a = 0xb6;
  //10110110  - a  补码
  //111111111111111111111111 10110110   整形提升过后的补码
  //111111111111111111111111 10110101   反码
  //100000000000000000000000 01001010   源码  = -74
  short b = 0xb600;
  int c = 0xb6000000;
  if (a == 0xb6)
    printf("a");
  if (b == 0xb600)
    printf("b");
  if (c == 0xb6000000)
    printf("c");
  return 0;
}



a,b整形提升之后,变成了负数,所以表达式 a==0xb6 , b==0xb600 的结果是假,但是c不发生整形提升,则表达式 c==0xb6000000 的结果是真.

实例2:

int main()
{
    char c = 1;
    printf("%u\n", sizeof(c));
    printf("%u\n", sizeof(+c));
    printf("%u\n", sizeof(-c));
    return 0;
}



六.数据的范围(char 为例)

我们知道char 是有 8 个比特位,如果是有符号的数(signed char),那么最高位就是符号位,有效数据为只有7位。如图:



这里还有一个圆形图:



如果是无符号数(unsigned char),最高位也看作是有效数据位。一共就有8位有效数据位。



最后:

虽然永远无法预料明天是晴还是雨,也无法预知你在乎的人是否还在身旁,以及你一直以来的坚持究竟能否换来什么。但你能决定的是,今天有没有备好雨伞,有没有好好爱自己,以及是否为自己追求的理想而拼尽全力。


相关文章
|
20天前
|
监控 算法 应用服务中间件
“四两拨千斤” —— 1.2MB 数据如何吃掉 10GB 内存
一个特殊请求引发服务器内存用量暴涨进而导致进程 OOM 的惨案。
|
18天前
|
C语言
【c语言】动态内存管理
本文介绍了C语言中的动态内存管理,包括其必要性及相关的四个函数:`malloc`、``calloc``、`realloc`和`free`。`malloc`用于申请内存,`calloc`申请并初始化内存,`realloc`调整内存大小,`free`释放内存。文章还列举了常见的动态内存管理错误,如空指针解引用、越界访问、错误释放等,并提供了示例代码帮助理解。
29 3
|
20天前
|
存储 C语言
数据在内存中的存储方式
本文介绍了计算机中整数和浮点数的存储方式,包括整数的原码、反码、补码,以及浮点数的IEEE754标准存储格式。同时,探讨了大小端字节序的概念及其判断方法,通过实例代码展示了这些概念的实际应用。
41 1
|
24天前
|
存储
共用体在内存中如何存储数据
共用体(Union)在内存中为所有成员分配同一段内存空间,大小等于最大成员所需的空间。这意味着所有成员共享同一块内存,但同一时间只能存储其中一个成员的数据,无法同时保存多个成员的值。
|
26天前
|
监控 Java easyexcel
面试官:POI大量数据读取内存溢出?如何解决?
【10月更文挑战第14天】 在处理大量数据时,使用Apache POI库读取Excel文件可能会导致内存溢出的问题。这是因为POI在读取Excel文件时,会将整个文档加载到内存中,如果文件过大,就会消耗大量内存。以下是一些解决这一问题的策略:
61 1
|
29天前
|
缓存 安全 Java
使用 Java 内存模型解决多线程中的数据竞争问题
【10月更文挑战第11天】在 Java 多线程编程中,数据竞争是一个常见问题。通过使用 `synchronized` 关键字、`volatile` 关键字、原子类、显式锁、避免共享可变数据、合理设计数据结构、遵循线程安全原则和使用线程池等方法,可以有效解决数据竞争问题,确保程序的正确性和稳定性。
35 2
|
20天前
|
存储 C语言
【c语言】字符串函数和内存函数
本文介绍了C语言中常用的字符串函数和内存函数,包括`strlen`、`strcpy`、`strcat`、`strcmp`、`strstr`、`strncpy`、`strncat`、`strncmp`、`strtok`、`memcpy`、`memmove`和`memset`等函数的使用方法及模拟实现。文章详细讲解了每个函数的功能、参数、返回值,并提供了具体的代码示例,帮助读者更好地理解和掌握这些函数的应用。
18 0
|
1月前
|
C语言 C++
C语言 之 内存函数
C语言 之 内存函数
32 3
|
4天前
|
C语言
c语言调用的函数的声明
被调用的函数的声明: 一个函数调用另一个函数需具备的条件: 首先被调用的函数必须是已经存在的函数,即头文件中存在或已经定义过; 如果使用库函数,一般应该在本文件开头用#include命令将调用有关库函数时在所需要用到的信息“包含”到本文件中。.h文件是头文件所用的后缀。 如果使用用户自己定义的函数,而且该函数与使用它的函数在同一个文件中,一般还应该在主调函数中对被调用的函数做声明。 如果被调用的函数定义出现在主调函数之前可以不必声明。 如果已在所有函数定义之前,在函数的外部已做了函数声明,则在各个主调函数中不必多所调用的函数在做声明
19 6
|
24天前
|
存储 缓存 C语言
【c语言】简单的算术操作符、输入输出函数
本文介绍了C语言中的算术操作符、赋值操作符、单目操作符以及输入输出函数 `printf` 和 `scanf` 的基本用法。算术操作符包括加、减、乘、除和求余,其中除法和求余运算有特殊规则。赋值操作符用于给变量赋值,并支持复合赋值。单目操作符包括自增自减、正负号和强制类型转换。输入输出函数 `printf` 和 `scanf` 用于格式化输入和输出,支持多种占位符和格式控制。通过示例代码详细解释了这些操作符和函数的使用方法。
33 10