C语言——数据在内存中的存储(上)(二)

简介: C语言——数据在内存中的存储(上)

4. 大小端介绍


概念:


大端(存储)模式,是指数据的低位保存在内存的高地址中,而数据的高位,保存在内存的低地址中;


小端(存储)模式,是指数据的低位保存在内存的低地址中,而数据的高位,,保存在内存的高地址中。


为什么有大端和小端?


为什么会有大小端模式之分呢?这是因为在计算机系统中,我们是以字节为单位的,每个地址单元都对应着一个字节,一个字节为8 bit。但是在C语言中除了8 bit的char之外,还有16 bit的short 型,32 bit的long型(要看具体的编译器),另外,对于位数大于8位的处理器,例如16位或者32 位的处理器,由于寄存器宽度大于一个字节,那么必然存在着一个如何将多个字节安排的问题。因此就导致了大端存储模式和小端存储模式。


例如:一个 16bit 的 short 型 x ,在内存中的地址为 0x0010 , x 的值为 0x1122 ,那么 0x11 为 高字节, 0x22 为低字节。对于大端模式,就将 0x11 放在低地址中,即 0x0010 中, 0x22 放在高 地址中,即 0x0011 中。小端模式,刚好相反。我们常用的 X86 结构是小端模式,而 KEIL C51 则 为大端模式。很多的ARM,DSP都为小端模式。有些ARM处理器还可以由硬件来选择是大端模式 还是小端模式。


427d992baedd06c2e066931b6eb129fe_0a296f3c5fe344ee8a41a55854b7c9e1.png


字节序:以字节为单位讨论数据的存储的。一个char类型只占用一个字节,所以对char类型讨论大小端字节序是没有意义的,这里大小端字节序是针对占用的内存空间大于1个字节的整数数据类型的。


大小端字节序是由电脑内置部件决定的,与编译器的类型无关。这里作者的电脑是以小端字节序存储的。


4.1 练习


Q1

请简述大端字节序和小端字节序的概念,设计一个小程序来判断当前机器的字节序。


Answer:


#include <stdio.h>
int check_sys()
{
     int i = 1;
     return (*(char *)&i);
}
int main()
{
     int ret = check_sys();
     if(ret == 1)
     {
         printf("小端\n");
     }
     else
     {
         printf("大端\n");
     }
  return 0;
}


以下是错误的写法:


int main()//这种是错误的
{
  int a = 0x11223344;
  char b = (char)a;//无论如何b拿到的都是a的最低字节的数据 
  if (b == 0x44)
  printf("小端!\n");
  if (b == 0x11)
  printf("大端!\n");
  return 0;
}

上面这段代码无论如何b拿到的都是a的最低字节的数据 。


Q2

//输出什么?
#include <stdio.h>
int main()
{
    char a= -1;
    unsigned char c=-1;
    printf("a=%d,c=%d",a,c);
    return 0;
}


char a= -1;//-1的二进制补码是32个1。因为char只有一个字节,存放不下,先发生截断,a中存放的就是8个1。


unsigned char c = -1;//c也是只有1个字节,发生截断,存放的也是8个1。


当 printf("a = %d,c = %d",a,c);执行时,由于%d代表的是有符号打印,所以a和c均会发生整形提升:


先看a的整形提升:a是有符号数,整形提升时补的是符号位,所以就补1,变成32个1,又因为是以有符号的形式打印,而符号位又是1,所以将32个1翻译成原码就是-1,即打印-1.


再看b的整形提升,b是无符号数,整形提升时,最高位补0,所以b就变成了24个0和8个1,又因为是以有符号的形式打印,而符号位是0,翻译成原码就是255。


运行结果:


ececf38d5466b1ba3e3ee32e49c678ca_c9033b4f64374957aefbe1c76227bc81.png


Q3

//输出什么?
#include <stdio.h>
int main()
{
    char a = -128;
    printf("%u\n",a);
    return 0;
}


-128的


原码:100000000000000000000000010000000


反码:111111111111111111111111101111111


补码:111111111111111111111111110000000


由于a只有8比特的空间,所以发生截断,a中存放的是:10000000


在执行 printf("%u\n",a);语句时,因为%u是无符号整形打印:所以a会发生整形提升,由于a是signed char,为有符号类型,整形提升时高位补符号位的数,也就是补1,所以此时a中存放的是:11111111111111111111111110000000,因为是%u无符号打印,所以直接将这串二进制序列看作原码进行打印。


运行结果:


65bb2ccca1b11eba6219301bf47cec09_e24d03ee355649b89347bf936354dadd.png


Q4

//输出什么?
#include <stdio.h>
int main()
{
    char a = 128;
    printf("%u\n",a);
    return 0;
}


先写出128的补码,再截断存储到a中,a中存放的也是:10000000,与Q3类似。


运行结果:


9a7779e7cf4ab6fb8b0fec8160a22ec2_c22ab6e96cc94d39b456d9c8cab18fa4.png


Q5

int main()
{
  //输出什么?
  int i = -20;
  unsigned  int  j = 10;
  printf("%d\n", i + j);
  //按照补码的形式进行运算,最后格式化成为有符号整数
  return 0;
}


先写出i的


原码:10000000000000000000000000010100


反码:11111111111111111111111111101011


补码:11111111111111111111111111101100


写出j的


补码:00000000000000000000000000001010


接着让这两个补码相加:


11111111111111111111111111101100+


00000000000000000000000000001010=


11111111111111111111111111110110


又因为是%d以有符号整形进行打印,所以将相加之后的二进制的最高位看作符号位。所以这里将相加得到的二进制序列转换成原码:10000000000000000000000000001010,也就是-1。


运行结果:


139adcd5133d7bfdb87d544e6393564a_2b0d4ea78ebe48048527a2f83d6dd9f2.png


Q6

//输出什么?
unsigned int i;
for(i = 9; i >= 0; i--)
{
    printf("%u\n",i);
}


这里由于i的数据类型是unsigned int 类型,是恒>=0的,所以I>0这个条件会一直满足,程序发生死循环。


运行结果:发生死循环


9afa6c78e17b5bc8be4d7a439f1e957a_eacdfa0cc5c147d89bf340dbd39010c5.png


Q7

//输出什么?
int main()
{
    char a[1000];
    int i;
    for(i=0; i<1000; i++)
   {
        a[i] = -1-i;
   }
    printf("%d",strlen(a));
    return 0;
}


这里arr[i]的值一开始是-1,-2,-3……当arr[i]的值变成-128时,,由本文之前画的图可知,此时再减1就会变成127,接着就是126,125,……1,0.这里strlen计算数组的长度时,会遇到’\0’才停止,而’\0’的ascll码值就是0,即这里数组的长度就是当arr[i]变成0之前的元素的个数,这里由-1到-128,再由-128到127再到1,一共有255个元素。所以结果就是255.


运行结果:


d5b0fb888a0f2b74ac079438d567f15d_ab038701ea1a4a5b96caa4f18d3ed98c.png


Q8

//输出什么?
#include <stdio.h>
unsigned char i = 0;
int main()
{
    for(i = 0;i<=255;i++)
   {
        printf("hello world\n");
   }
    return 0;
}

此处由于i的数据类型是unsigned char 其数据范围是[0,255],始终是大于0的,所以会一直打印,发生死循环。


运行结果:发生死循环

3e4d497cca8f76f7f34c5d5708bd494f_dc79ccf9e3c242f0b4263c12e7f04bac.png


相关文章
|
23天前
|
监控 算法 应用服务中间件
“四两拨千斤” —— 1.2MB 数据如何吃掉 10GB 内存
一个特殊请求引发服务器内存用量暴涨进而导致进程 OOM 的惨案。
|
22天前
|
存储 C语言
数据在内存中的存储方式
本文介绍了计算机中整数和浮点数的存储方式,包括整数的原码、反码、补码,以及浮点数的IEEE754标准存储格式。同时,探讨了大小端字节序的概念及其判断方法,通过实例代码展示了这些概念的实际应用。
46 1
|
27天前
|
存储
共用体在内存中如何存储数据
共用体(Union)在内存中为所有成员分配同一段内存空间,大小等于最大成员所需的空间。这意味着所有成员共享同一块内存,但同一时间只能存储其中一个成员的数据,无法同时保存多个成员的值。
|
29天前
|
监控 Java easyexcel
面试官:POI大量数据读取内存溢出?如何解决?
【10月更文挑战第14天】 在处理大量数据时,使用Apache POI库读取Excel文件可能会导致内存溢出的问题。这是因为POI在读取Excel文件时,会将整个文档加载到内存中,如果文件过大,就会消耗大量内存。以下是一些解决这一问题的策略:
69 1
|
1月前
|
缓存 安全 Java
使用 Java 内存模型解决多线程中的数据竞争问题
【10月更文挑战第11天】在 Java 多线程编程中,数据竞争是一个常见问题。通过使用 `synchronized` 关键字、`volatile` 关键字、原子类、显式锁、避免共享可变数据、合理设计数据结构、遵循线程安全原则和使用线程池等方法,可以有效解决数据竞争问题,确保程序的正确性和稳定性。
37 2
|
23天前
|
存储 C语言
【c语言】字符串函数和内存函数
本文介绍了C语言中常用的字符串函数和内存函数,包括`strlen`、`strcpy`、`strcat`、`strcmp`、`strstr`、`strncpy`、`strncat`、`strncmp`、`strtok`、`memcpy`、`memmove`和`memset`等函数的使用方法及模拟实现。文章详细讲解了每个函数的功能、参数、返回值,并提供了具体的代码示例,帮助读者更好地理解和掌握这些函数的应用。
19 0
|
3月前
|
存储 编译器 C语言
【C语言篇】数据在内存中的存储(超详细)
浮点数就采⽤下⾯的规则表⽰,即指数E的真实值加上127(或1023),再将有效数字M去掉整数部分的1。
370 0
|
1月前
|
存储 弹性计算 算法
前端大模型应用笔记(四):如何在资源受限例如1核和1G内存的端侧或ECS上运行一个合适的向量存储库及如何优化
本文探讨了在资源受限的嵌入式设备(如1核处理器和1GB内存)上实现高效向量存储和检索的方法,旨在支持端侧大模型应用。文章分析了Annoy、HNSWLib、NMSLib、FLANN、VP-Trees和Lshbox等向量存储库的特点与适用场景,推荐Annoy作为多数情况下的首选方案,并提出了数据预处理、索引优化、查询优化等策略以提升性能。通过这些方法,即使在资源受限的环境中也能实现高效的向量检索。
|
1月前
|
存储 编译器
数据在内存中的存储
数据在内存中的存储
41 4
|
1月前
|
存储 Java
JVM知识体系学习四:排序规范(happens-before原则)、对象创建过程、对象的内存中存储布局、对象的大小、对象头内容、对象如何定位、对象如何分配
这篇文章详细地介绍了Java对象的创建过程、内存布局、对象头的MarkWord、对象的定位方式以及对象的分配策略,并深入探讨了happens-before原则以确保多线程环境下的正确同步。
53 0
JVM知识体系学习四:排序规范(happens-before原则)、对象创建过程、对象的内存中存储布局、对象的大小、对象头内容、对象如何定位、对象如何分配