深度剖析数据在内存中的存储(上)

简介: 深度剖析数据在内存中的存储(上)

本章重点


1. 数据类型详细介绍


2. 整形在内存中的存储:原码、反码、补码


3. 大小端字节序介绍及判断


4. 浮点型在内存中的存储解析  




1. 数据类型介绍


我们已经学习过数据的基本内置类型:


char        //字符数据类型


short       //短整型


int         //整形


long        //长整型


long long   //更长的整形


float       //单精度浮点数


double      //双精度浮点数


C语言有没有字符串类型?


答案是没有。字符串是一种非常重要的数据类型,但是C语言不存在显式的字符串类型,C语言中的字符串都以字符串常量的形式出现或存储在字符数组中。同时,C 语言提供了一系列库函数来对操作字符串,这些库函数都包含在头文件 string.h 中。


那究竟什么是字符串变量呢?


C 语言虽然没有字符串类型,但是 C语言提是存在字符串这个概念的,也就是字符串常量:以 NUL 字节结尾的 0 个或多个字符组成的序列。字符串常量是不可被修改的,一般用一对双引号(" ")括起的一串字符来表示字符串常量,如:


"hello world","sun wu kong",""等。


字符串常量可以为空,如""就是一个空的字符串常量,但是即使为空,还是存在一个终止符 NUL 的。(在 C 语言中,常用转义字符 \0 来表示 NUL)


1.1 类型的基本归类


整形家族:


char


  unsigned char    signed char


short


  unsigned short   [int] signed short [int]


int


  unsigned int       signed int


long


  unsigned long [int]     signed long [int]


这么一看和单词书一样,我知道大家急,但是仙布急!


336b0c80233c41b6c8042daa5cb5b543_499ebf38d96c48c5a9dbc0bf3493782d.png


所有的整形都是有规律的,基本都分为signed和unsigned两种。


两种类型的区别,在下文将会讲解。


浮点数家族:


float


double


构造类型:


> 数组类型


> 结构体类型 struct


> 枚举类型  enum


> 联合类型  union


指针类型:


int *pi;


char *pc;


float* pf;


void* pv;


空类型:


void 表示空类型(无类型)


通常应用于函数的返回类型、函数的参数、指针类型


2. 整形在内存中的存储


一个变量的创建是要在内存中开辟空间的。而空间的大小是根据不同的类型而决定的。


接下来我们就来谈谈数据在所开辟内存中到底是如何存储的


比如:


int a = 20;


int b = -10;


我们知道为 a 分配四个字节的空间。


那如何存储? 下来了解下面的概念:


2.1 原码、反码、补码


计算机中的整数有三种2进制表示方法,即原码、反码和补码。


三种表示方法均有符号位和数值位两部分,符号位都是用0表示“正”,用1表示“负”,而数值位正数的原、反、补码都相同。


负整数的三种表示方法各不相同。


原码


直接将数值按照正负数的形式翻译成二进制就可以得到原码。


反码


将原码的符号位不变,其他位依次按位取反就可以得到反码。


补码


反码+1就得到补码。


对于整形来说:数据存放内存中其实存放的是补码。


为什么呢?


在计算机系统中,数值一律用补码来表示和存储。原因在于,使用补码,可以将符号位和数值域统一处理; 同时,加法和减法也可以统一处理(CPU只有加法器)此外,补码与原码相互转换,其运算过程 是相同的,不需要额外的硬件电路。


我们看看在内存中的存储:  


411ce575ffb3f7d5484d8c8751033b33_401f29fd8b57476b8d74b2fd27204a56.png


038768e9fb5b70cb612595ca77fe0b6d_24310488c37c48009df40f13b8059a7a.png

我们可以看到对于a和b分别存储的是补码。但是我们发现顺序有点不对劲。


这是又为什么?


2.2 大小端介绍


什么是大端小端:


大端(存储)模式,是指数据的低位保存在内存的高地址中,而数据的高位,保存在内存的低地址 中;


小端(存储)模式,是指数据的低位保存在内存的低地址中,而数据的高位,,保存在内存的高地 址中。


为什么有大端和小端:


为什么会有大小端模式之分呢?这是因为在计算机系统中,我们是以字节为单位的,每个地址单元 都对应着一个字节,一个字节为8 bit。但是在C语言中除了8 bit的char之外,还有16 bit的short 型,32 bit的long型(要看具体的编译器),另外,对于位数大于8位的处理器,例如16位或者32 位的处理器,由于寄存器宽度大于一个字节,那么必然存在着一个如何将多个字节安排的问题。因 此就导致了大端存储模式和小端存储模式。


例如:一个 16bit 的 short 型 x ,在内存中的地址为 0x0010 , x 的值为 0x1122 ,那么 0x11 为 高字节, 0x22 为低字节。对于大端模式,就将 0x11 放在低地址中,即 0x0010 中, 0x22 放在高 地址中,即 0x0011 中。小端模式,刚好相反。我们常用的 X86 结构是小端模式,而 KEIL C51 则 为大端模式。很多的ARM,DSP都为小端模式。有些ARM处理器还可以由硬件来选择是大端模式 还是小端模式。


2.3 一道小题


百度2015年系统工程师笔试题:


请简述大端字节序和小端字节序的概念,设计一个小程序来判断当前机器的字节序。


大端字节序和小端字节序的概念上面已经给出,下面是判断字节序的代码。


#include <stdio.h>
int check_sys()
{
 int i = 1;
 return (*(char *)&i);
}
int main()
{
 int ret = check_sys();
 if(ret == 1)
 {
 printf("小端\n");
 }
 else
 {
 printf("大端\n");
 }
 return 0;
}


如图,若取出的第一个的数据为 1,则是小端模式,是 0,则是大端模式。


c7c8c466aad811fbe9a8bed6820d6743_bbc0ce18e7634f3cbf4b7b9b1f7853f4.png


整形在内存中的储存就到此为止,浮点数的储存方式将会在下一篇文章讲解。


文章如果有错误,还请各位大佬不吝赐教!


相关文章
|
20天前
|
监控 算法 应用服务中间件
“四两拨千斤” —— 1.2MB 数据如何吃掉 10GB 内存
一个特殊请求引发服务器内存用量暴涨进而导致进程 OOM 的惨案。
|
19天前
|
存储 C语言
数据在内存中的存储方式
本文介绍了计算机中整数和浮点数的存储方式,包括整数的原码、反码、补码,以及浮点数的IEEE754标准存储格式。同时,探讨了大小端字节序的概念及其判断方法,通过实例代码展示了这些概念的实际应用。
41 1
|
24天前
|
存储
共用体在内存中如何存储数据
共用体(Union)在内存中为所有成员分配同一段内存空间,大小等于最大成员所需的空间。这意味着所有成员共享同一块内存,但同一时间只能存储其中一个成员的数据,无法同时保存多个成员的值。
|
26天前
|
监控 Java easyexcel
面试官:POI大量数据读取内存溢出?如何解决?
【10月更文挑战第14天】 在处理大量数据时,使用Apache POI库读取Excel文件可能会导致内存溢出的问题。这是因为POI在读取Excel文件时,会将整个文档加载到内存中,如果文件过大,就会消耗大量内存。以下是一些解决这一问题的策略:
61 1
|
28天前
|
存储 弹性计算 算法
前端大模型应用笔记(四):如何在资源受限例如1核和1G内存的端侧或ECS上运行一个合适的向量存储库及如何优化
本文探讨了在资源受限的嵌入式设备(如1核处理器和1GB内存)上实现高效向量存储和检索的方法,旨在支持端侧大模型应用。文章分析了Annoy、HNSWLib、NMSLib、FLANN、VP-Trees和Lshbox等向量存储库的特点与适用场景,推荐Annoy作为多数情况下的首选方案,并提出了数据预处理、索引优化、查询优化等策略以提升性能。通过这些方法,即使在资源受限的环境中也能实现高效的向量检索。
|
29天前
|
缓存 安全 Java
使用 Java 内存模型解决多线程中的数据竞争问题
【10月更文挑战第11天】在 Java 多线程编程中,数据竞争是一个常见问题。通过使用 `synchronized` 关键字、`volatile` 关键字、原子类、显式锁、避免共享可变数据、合理设计数据结构、遵循线程安全原则和使用线程池等方法,可以有效解决数据竞争问题,确保程序的正确性和稳定性。
35 2
|
4月前
|
存储 分布式计算 Hadoop
HadoopCPU、内存、存储限制
【7月更文挑战第13天】
276 14
|
3月前
|
存储 编译器 C语言
【C语言篇】数据在内存中的存储(超详细)
浮点数就采⽤下⾯的规则表⽰,即指数E的真实值加上127(或1023),再将有效数字M去掉整数部分的1。
357 0
|
1月前
|
存储 编译器
数据在内存中的存储
数据在内存中的存储
37 4
|
1月前
|
存储 Java
JVM知识体系学习四:排序规范(happens-before原则)、对象创建过程、对象的内存中存储布局、对象的大小、对象头内容、对象如何定位、对象如何分配
这篇文章详细地介绍了Java对象的创建过程、内存布局、对象头的MarkWord、对象的定位方式以及对象的分配策略,并深入探讨了happens-before原则以确保多线程环境下的正确同步。
51 0
JVM知识体系学习四:排序规范(happens-before原则)、对象创建过程、对象的内存中存储布局、对象的大小、对象头内容、对象如何定位、对象如何分配