数据在内存中的存储(1)

简介: 数据在内存中的存储(1)


1. 数据类型介绍

前面我们已经学习了基本的内置类型以及它们所占存储空间的大小(单位:字节):

char — 字符数据类型 — 1

short — 短整型 — 2

int — 整形 — 4

long — 长整型 — 4/8

long long — 更长的整形 — 8

float — 单精度浮点数 — 4

double — 双精度浮点数 — 8

long double

类型的意义:

  1. 使用这个类型开辟内存空间的大小(大小决定了使用范围)。
  2. 如何看待内存空间的视角。

1.1 类型的基本归类

整形家族:

char

  unsigned char

  signed char

short

  unsigned short [int]

  signed short [int]

int

  unsigned int

  signed int

long

  unsigned long [int]

  signed long [int]

long long

  unsigned long long [int]

  signed long long [int]

注:

字符存储的时候,存储的是ASCII码值,是整型,所以归类的时候放在整型家族。

浮点数家族:

float

double

long double

构造类型:

数组类型

int arr1[10]; — int [10]

int arr2[5]; — int [5]

char arr3[5]; — char[5]

结构体类型 struct

枚举类型 enum

联合类型 union

指针类型:

int *pi;

char *pc;

float *pf;

void *pv;

结构体的指针

空类型:

void 表示空类型(无类型)

通常应用于函数的返回类型、函数的参数、指针类型。

2. 整形在内存中的存储

我们之前讲过一个变量的创建是要在内存中开辟空间的,空间的大小是根据不同的类型而决定的。

#include <limits.h>
int main()
{
  INT_MAX;
  return 0;
}

那接下来我们谈谈数据在所开辟内存中到底是如何存储的?

比如:

int a = 20;
int b = -10;

我们知道为a分配四个字节的空间,那如何存储?

2.1 原码、反码、补码

计算机中的整数有三种2进制表示方法,即原码、反码和补码。三种表示方法均有符号位数值位两部分,符号位都是用0表示“正”,用1表示“负”。

正数的原、反、补码都相同。

负整数的三种表示方法各不相同。

原码

直接将数值按照正负数的形式翻译成二进制就可以得到原码。

反码

将原码的符号位不变,其他位依次按位取反就可以得到反码。

补码

反码+1就得到补码

int main()
{
  int num = 10;//创建一个整型变量,叫num,这时num向内存申请4个字节来存放数据
  //4个字节 - 32比特位
  //00000000000000000000000000001010 - 原码
  //00000000000000000000000000001010 - 反码
  //00000000000000000000000000001010 - 补码
  int num2 = -10;
  //10000000000000000000000000001010 - 原码
  //11111111111111111111111111110101 - 反码
  //11111111111111111111111111110110 - 补码
  return 0;
}

对于整形来说:数据存放内存中其实存放的是补码

为什么呢?

在计算机系统中,数值一律用补码来表示和存储。原因在于,使用补码,可以将符号位和数值域统一处理;同时,加法和减法也可以统一处理(CPU只有加法器)此外,补码与原码相互转换,其运算过程是相同的,不需要额外的硬件电路。

//计算1-1
//1+(-1)
// 00000000000000000000000000000001 --> 1的补码
// 11111111111111111111111111111111 --> -1的补码
// 00000000000000000000000000000000
//
//原码计算是错误的
//00000000000000000000000000000001
//10000000000000000000000000000001
//10000000000000000000000000000010 --> -2

我们看看在内存中的存储:

int main()
{
  int num = 10;//创建一个整型变量,叫num,这时num向内存申请4个字节来存放数据
  //4个字节 - 32比特位
  //00000000000000000000000000001010 - 原码
  //00000000000000000000000000001010 - 反码
  //00000000000000000000000000001010 - 补码
  int num2 = -10;
  //10000000000000000000000000001010 - 原码
  //11111111111111111111111111110101 - 反码
  //11111111111111111111111111110110 - 补码
  return 0;
}

数据在内存中存储的是补码(本质上内存中存放的是二进制,在VS上为了方便展示,显示的是16进制),但是我们发现顺序有点不对劲,这又是为什么呢?

2.2 大小端介绍

int main()
{
  int a = 0x11223344;
  return 0;
}

  1. 字节序是以字节为单位,讨论存储顺序的
  2. 大端(存储)模式,是指数据的低位保存在内存的高地址中,而数据的高位,保存在内存的低地址中
  3. 小端(存储)模式,是指数据的低位保存在内存的低地址中,而数据的高位,保存在内存的高地址中

为什么有大端和小端:

为什么会有大小端模式之分呢?这是因为在计算机系统中,我们是以字节为单位的,每个地址单元都对应着一个字节,一个字节为8bit。但是在C语言中除了8bit的char之外,还有16bit的short型,32bit的long型(要看具体的编译器),另外,对于位数大于8位的处理器,例如16位或者32位的处理器,由于寄存器宽度大于一个字节,那么必然存在着一个如何将多个字节安排的问题。因此就导致了大端存储模式和小端存储模式。

例如:一个16bit的short型x,在内存中的地址为 0x0010,x的值为0x1122,那么0x11为高字节,0x22为低字节。对于大端模式,就将0x11放在低地址中,即0x0010中,0x22放在高地址中,即0x0011中。小端模式,刚好相反。我们常用的X86结构是小端模式,而KEIL C51则为大端模式。很多的ARM,DSP都为小端模式。有些ARM处理器还可以由硬件来选择是大端模式还是小端模式。

设计一个小程序来判断当前机器的字节序

#include <stdio.h>
int main()
{
  int a = 1;
  char* p = (char*)&a;
  if (1 == *p)
  {
    printf("小端\n");
  }
  else
  {
    printf("大端\n");
  }
  return 0;
}
#include <stdio.h>
int main()
{
  int a = 1;
  if (1 == *(char*)&a)
  {
    printf("小端\n");
  }
  else
  {
    printf("大端\n");
  }
  return 0;
}
#include <stdio.h>
int check_sys()
{
  int a = 1;
  if (1 == *(char*)&a)
  {
    return 1;
  }
  else
  {
    return 0;
  }
}
int main()
{
  int ret = check_sys();
  if (1 == ret)
  {
    printf("小端\n");
  }
  else
  {
    printf("大端\n");
  }
  return 0;
}
#include <stdio.h>
//小端返回1
//大端返回0
int check_sys()
{
  int a = 1;
  return *(char*)&a;
}
int main()
{
  int ret = check_sys();
  if (1 == ret)
  {
    printf("小端\n");
  }
  else
  {
    printf("大端\n");
  }
  return 0;
}

2.3 练习


#include <stdio.h>
int main()
{
  char a = -1;
  //100000000000000000000001
  //111111111111111111111110
  //111111111111111111111111 - 截断
  //11111111 - a
  //111111111111111111111111
  //111111111111111111111110
  //100000000000000000000001 --> -1
  signed char b = -1;
  //111111111111111111111111
  //11111111 - b
  unsigned char c = -1;
  //11111111 - c
  //000000000000000011111111 - 补码
  //000000000000000011111111
  //000000000000000011111111 - 原码
  printf("a=%d,b=%d,c=%d", a, b, c);//a=-1,b=-1,c=255
  //%d - 十进制的形式打印有符号整型整数
  //整型提升
  return 0;
}
#include <stdio.h>
int main()
{
  char a = -128;
  //-128
  //10000000000000000000000010000000
  //11111111111111111111111101111111
  //11111111111111111111111110000000 - -128的补码
  //10000000 - a中存的
  //11111111111111111111111110000000 - 整型提升后的补码
  //11111111111111111111111110000000
  //11111111111111111111111110000000 - 原码
  printf("%u\n", a);//4294967168
  
  return 0;
}
#include <stdio.h>
int main()
{
  char a = 128;
  //00000000000000000000000010000000
  //00000000000000000000000010000000
  //00000000000000000000000010000000
  //10000000 - a中存的
  //11111111111111111111111110000000 - 整型提升后的补码
  //11111111111111111111111110000000
  //11111111111111111111111110000000 - 原码
  printf("%u\n", a);//4294967168
  
  return 0;
}
#include <stdio.h>
int main()
{
  int i = -20;
  //10000000000000000000000000010100
  //11111111111111111111111111101011
  //11111111111111111111111111101100
  unsigned int j = 10;
  //00000000000000000000000000001010
  printf("%d\n", i + j);//-10
  //按照补码的形式进行运算,最后格式化成为有符号整数
  //11111111111111111111111111110110
  //11111111111111111111111111110101
  //10000000000000000000000000001010
  //11111111111111111111111111110110
  //10000000000000000000000000001001
  //10000000000000000000000000001010
  return 0;
}
//原码 --> 先取反,再加1 --> 补码
//补码 --> 先减1,再取反 --> 原码
//补码 --> 先取反,再加1 --> 原码
#include <stdio.h>
#include <windows.h>
int main()
{
  unsigned int i;//无符号数恒大于0
  
  for (i = 9; i >= 0; i--)
  {
    printf("%u\n", i);//死循环 9 8 7 6 5 4 3 2 1 0 4294967295 4294967294 ...
    Sleep(1000);//单位是毫秒
  }
  return 0;
}
#include <stdio.h>
#include <string.h>
int main()
{
  char a[1000];//char -128~127
  int i;
  
  for (i = 0; i < 1000; i++)
  {
    a[i] = -1 - i;//-1 -2 -3 ... -128 127 126 ... 2 1 0 -1 -2 ... -128 127 126 ... 2 1 0 ...
  }
  
  printf("%d", strlen(a));//strlen是求字符串长度的,统计的是\0之前出现的字符的个数;\0的ASCII码值是0
  //255
  
  return 0;
}
#include <stdio.h>
unsigned char i = 0;//0~255
int main()
{
  
  for (i = 0; i <= 255; i++)//i <= 255 恒成立
  {
    printf("hello world\n");//死循环打印hello world
  }
  
  return 0;
}


目录
相关文章
|
22天前
|
监控 算法 应用服务中间件
“四两拨千斤” —— 1.2MB 数据如何吃掉 10GB 内存
一个特殊请求引发服务器内存用量暴涨进而导致进程 OOM 的惨案。
|
21天前
|
存储 C语言
数据在内存中的存储方式
本文介绍了计算机中整数和浮点数的存储方式,包括整数的原码、反码、补码,以及浮点数的IEEE754标准存储格式。同时,探讨了大小端字节序的概念及其判断方法,通过实例代码展示了这些概念的实际应用。
43 1
|
25天前
|
存储
共用体在内存中如何存储数据
共用体(Union)在内存中为所有成员分配同一段内存空间,大小等于最大成员所需的空间。这意味着所有成员共享同一块内存,但同一时间只能存储其中一个成员的数据,无法同时保存多个成员的值。
|
28天前
|
监控 Java easyexcel
面试官:POI大量数据读取内存溢出?如何解决?
【10月更文挑战第14天】 在处理大量数据时,使用Apache POI库读取Excel文件可能会导致内存溢出的问题。这是因为POI在读取Excel文件时,会将整个文档加载到内存中,如果文件过大,就会消耗大量内存。以下是一些解决这一问题的策略:
67 1
|
30天前
|
存储 弹性计算 算法
前端大模型应用笔记(四):如何在资源受限例如1核和1G内存的端侧或ECS上运行一个合适的向量存储库及如何优化
本文探讨了在资源受限的嵌入式设备(如1核处理器和1GB内存)上实现高效向量存储和检索的方法,旨在支持端侧大模型应用。文章分析了Annoy、HNSWLib、NMSLib、FLANN、VP-Trees和Lshbox等向量存储库的特点与适用场景,推荐Annoy作为多数情况下的首选方案,并提出了数据预处理、索引优化、查询优化等策略以提升性能。通过这些方法,即使在资源受限的环境中也能实现高效的向量检索。
|
1月前
|
缓存 安全 Java
使用 Java 内存模型解决多线程中的数据竞争问题
【10月更文挑战第11天】在 Java 多线程编程中,数据竞争是一个常见问题。通过使用 `synchronized` 关键字、`volatile` 关键字、原子类、显式锁、避免共享可变数据、合理设计数据结构、遵循线程安全原则和使用线程池等方法,可以有效解决数据竞争问题,确保程序的正确性和稳定性。
36 2
|
1月前
|
存储 编译器
数据在内存中的存储
数据在内存中的存储
41 4
|
1月前
|
存储 Java
JVM知识体系学习四:排序规范(happens-before原则)、对象创建过程、对象的内存中存储布局、对象的大小、对象头内容、对象如何定位、对象如何分配
这篇文章详细地介绍了Java对象的创建过程、内存布局、对象头的MarkWord、对象的定位方式以及对象的分配策略,并深入探讨了happens-before原则以确保多线程环境下的正确同步。
53 0
JVM知识体系学习四:排序规范(happens-before原则)、对象创建过程、对象的内存中存储布局、对象的大小、对象头内容、对象如何定位、对象如何分配
|
4月前
|
存储 分布式计算 Hadoop
HadoopCPU、内存、存储限制
【7月更文挑战第13天】
277 14
|
3月前
|
存储 编译器 C语言
【C语言篇】数据在内存中的存储(超详细)
浮点数就采⽤下⾯的规则表⽰,即指数E的真实值加上127(或1023),再将有效数字M去掉整数部分的1。
366 0