【C语言】探索数据的存储(整形篇)

简介: 【C语言】探索数据的存储(整形篇)

1. 前言


C语言中,我们经常使用数据类型,那么整形数据在内存中如何存储?存储方式是什么?如果你对这些内容不太了解的话,相信看完这篇博客后,你会对整形数据的存储有一个新的认识。话不多说,我们进入正题。



2. 数据类型


C语言中存在着数据类型,我们或多或少都见到过。


   char //字符数据类型 - 1个字节

   short //短整型 - 2个字节

   int //整形 - 4个字节

   long //长整型 - 4/8个字节

   long long //更长的整形 - 8个字节

   float //单精度浮点数 - 4个字节

   double //双精度浮点数 - 8个字节


小思考:C语言有没有字符串类型?


C语言有字符串,表示为"字符串内容"的形式,但不存在字符串类型。


类型存在的意义是什么?


  1. 使用这个类型开辟内存空间的大小(大小决定使用范围)。
  2. 如何看待内存空间的视角(例如指针解引用和指针运算)。



3. 类型的分类


整形

char
  unsigned char
  signed char
//虽然是字符类型,但是字符类型存储的时候,存储的字符的ascii码值,ascii码值是整数
short
  unsigned short [int]
  signed short [int]
int
  unsigned int
  signed int
long
  unsigned long [int]
  signed long [int]


unsigned 和 signed

   unsigned:无符号,只有正数的数据可以存放在无符号的变量中。

   signed:有符号,有正负的数据可以存放在有符号的变量中。


Tips:


对于short,int,long,long long数据在进行定义时,默认都为signed。而对于char类型则不确定,C语言标准没有规定char是否有符号,取决于编译器,所以char实际上可以归为3类,char(不确定),signed char(有符号),unsigned char(无符号)。在vs2022中,char默认为signed char。


浮点型

float//单精度浮点数 - 4个字节
double//双精度浮点数 - 8个字节




构造类型

//例:int arr[10]
数组类型 int [10]
//数组只要个数和元素类型发生变化,类型都会发生变化
结构体类型 struct
枚举类型 enum
联合类型 union



指针类型

int *pi;//整形指针
char *pc;//字符指针
float* pf;//单精度浮点数指针
void* pv;//空类型指针



空类型


void 表示空类型(无类型)

通常应用于函数的返回类型、函数的参数、指针类型。


例:

void test1()//无返回值
{}
void test2(void)//函数接收参数,参数部分加void
{}
int main()
{
  void* p = NULL;
  //void*可以存放任何类型的指针
  int a = 10;
  void* p1 = &a;//没问题
  p1++;//err,不知道类型,无法决定跳过几个字节
  *p1;//err,不知道类型,无法决定解引用的权限
  //一般用来临时存放地址,用的时候拿走或者强转使用
  return 0;
}




4. 整形在内存中的存储


一个整形变量的创建需要再内存中开辟四个字节,那整形在内存中是如何存储的?

比如:

int a = 10;

int b = -10;

在了解整形在内存中如何存储之前我们需要了解以下概念:





4.1 原码、反码、补码


计算机中的整数有三种2进制表示方法,即原码、反码、补码。

三种表示方法均有符号位和数值位两部分,二进制序列的第一位为符号位,其他均为数值位,符号位数值位均由0,1组成。



原码:

直接将数值按照正负的形式翻译成二进制就可以。


反码:

原码的符号位不便,其他位依次按位取反就可以得到。


补码:

反码 + 1得到补码。



注意:

  • 正整数的原码、反码、补码都相同。
  • 负整数的三种表示方式各不相同,需要通过计算得到。

样例:

int a = 10;//整形值
//0000 0000 0000 0000 0000 0000 0000 1010 a的原、反、补
//转化为16进制:0X0000000a
int b = -10;//整形值
//1000 0000 0000 0000 0000 0000 0000 1010 b的原码
//1111 1111 1111 1111 1111 1111 1111 0101 b的反码
//1111 1111 1111 1111 1111 1111 1111 0110 b的补码
//转化为16进制:0Xfffffff6

那么对于整形而言,在内存中存储的是什么呢?

让我们启动调试,查看内存:


2e274a2327c239e29640762fa0486ee5.png



我们可以看到对于a和b分别存储的是补码,这是为什么?

   在计算机系统中,数值一律用补码来表示和存储。原因在于,使用补码,可以将符号位和数值域统一处理;

   同时,加法和减法也可以统一处理(CPU只有加法器)此外,补码与原码相互转换,其运算过程是相同的,不需要额外的硬件电路。


举个简单的例子,例如计算机在计算a - b的时候,会转化成a + (-b)的形式进行计算,而这时使用原码来进行计算,是无法计算出结果的,但使用补码就可以计算出结果。


但是对于数据在内存中存储的方式很奇怪,它是倒着存储的,这是为什么?让我们了解一下大小端。




4.2 大小端介绍


什么是大端小端


大端字节序存储:把一个数据低位字节处的数据存放在高地址处,把高位字节处的数据放在低地址处

小端字节序存储:把一个数据低位字节处的数据存放在低地址处,把高位字节处的数据放在高地址处。

例如:

0x11223344

a3f457ce8dc4c823fe8a6a756525fbd7.png



为什么会有大端和小端:


   为什么会有大小端模式之分呢?这是因为在计算机系统中,我们是以字节为单位的,每个地址单元都对应着一个字节,一个字节为8 bit。但是在C语言中除了8 bit的char之外,还有16 bit的short型,32 bit的long型(要看具体的编译器),另外,对于位数大于8位的处理器,例如16位或者32位的处理器,由于寄存器宽度大于一个字节,那么必然存在着一个如何将多个字节安排的问题。因此就导致了大端存储模式和小端存储模式。


   例如:一个16bit 的short 型x ,在内存中的地址为0x0010 , x 的值为0x1122 ,那么0x11 为高字节, 0x22 为低字节。对于大端模式,就将0x11 放在低地址中,即0x0010 中, 0x22 放在高地址中,即0x0011 中。小端模式,刚好相反。我们常用的X86 结构是小端模式,而KEIL C51 则为大端模式。很多的ARM,DSP都为小端模式。有些ARM处理器还可以由硬件来选择是大端模式还是小端模式。


其实数据在内存中无论是大小端存储或者乱序存储都可以,大小端字节序存储也是为了让存储方式变得更简单,如果乱序存储的话在还原数据时会更加复杂。


注:大小端存储时以字节为单元,16进制的两位为一个字节,为一个单元,按照大小端存储规律存储,并不会将16进制的每一位都倒过来存储。例如0x123456按照小端存储就为56 34 12 00,而不是65 43 21 00。


所以说大小端字节序存储,就是以字节为单位的存储顺序。



4.2.1 一道笔试题


请简述大端字节序和小端字节序的概念,设计一个小程序来判断当前机器的字节序。


思路:数据在内存中是通过补码的形式储存的,判断大端还是小端,例如数字1,我们只需要观察它的第一个字节为0或1,就可以判断字节序。而数据类型决定了指针解引用时看待内存的视角,所以我们可以用char*指针来对元素第一个字节的内容进行解引用。

int check_sys()
{
  int a = 1;
  //二进制:0000 0000 0000 0000 0000 0000 0000 0001
  //十六进制:0x00000001
  char* p = (char*)&a;//char*指针解引用为一个字节
  if (*p == 1)
    return 1;
  else
    return 0;
}
//简化
//int check_sys()
//{
//  int a = 1;
//  return *(char*)&a;//1的大端或小端存储,第一位为00或者01,取出的值正好和main函数中接收的值相同,直接返回
//}
int main()
{
  int ret = check_sys();
  if (ret = 1)
  {
    printf("小端\n");
  }
  else
  {
    printf("大端\n");
  }
}



4.3 char类型数据的取值范围


char在内存中存储的是字符的Ascii码值,所以也归于整形。但是它的取值范围和整形不同。

char类型变量的大小为1个byte,也就是8个bit位,对于char类型,我们分signed和unsigned两块进行讲解。


signed:

signed为有符号字符类型,二进制序列的第一位为符号位,其他位为数据位,取值范围为-128 ~ 127.

unsigned:

unsigned为无符号字符类型,二进制序列全为数据位,取值范围为0 ~ 255.

图例:


d0a58cb98cf9d2e05f230413da3c7620.png


5. 练习


5.1 练习1



下列程序的输出结果是什么?

int main()
{
  char a = -1;
  //整形提升
    //1000 0000 0000 0000 0000 0000 0000 0001
  //1111 1111 1111 1111 1111 1111 1111 1110
  //1111 1111 1111 1111 1111 1111 1111 1111
    //截断:1111 1111
    //整形提升
  //1111 1111 1111 1111 1111 1111 1111 1111 - 补码
  //1000 0000 0000 0000 0000 0000 0000 0000
  //1000 0000 0000 0000 0000 0000 0000 0000 - 原码
    //-1
  signed char b = -1;
  //求解过程和a相同
  unsigned char c = -1;
  //截断:1111 1111
    //无符号字符,整形提升,高位补0
    //0000 0000 0000 0000 0000 0000 1111 1111 - 补码==原码
    //截断:1111 1111
  printf("a=%d,b=%d,c=%d", a, b, c);//-1,-1,255
  //当打印a,b,c时,要整形提升
  return 0;
}

运行结果:

37dd5d35277087489f273581c6af887c.png


5.2 练习 2

下列程序的输出结果是什么?

int main()
{
  char a = -128;
  //1000 0000 0000 0000 0000 0000 1000 0000
  //1111 1111 1111 1111 1111 1111 0111 1111
  //1111 1111 1111 1111 1111 1111 1000 0000
  //截断:1000 0000
  //%u - 指的是打印无符号整数
  //整形提升
    //有符号字符,补符号位
  //1111 1111 1111 1111 1111 1111 1000 0000 - 要打印原码,而这是无符号数,所以这个就是原码
  printf("%u\n", a);//4294967168
  return 0;
}


运行结果:


5286a606397fe9a3e2792b31a88b0d73.png

5.3 练习 3

下列程序的输出结果是什么?

int main()
{
  char a = 128;
  //0000 0000 0000 0000 0000 0000 1000 0000
  //1111 1111 1111 1111 1111 1111 0111 1111
  //1111 1111 1111 1111 1111 1111 1000 0000
  //截断1000 0000
  //整形提升
    //有符号字符,补符号位
  //1111 1111 1111 1111 1111 1111 1000 0000 - 原码
  printf("%u\n", a);//?
  return 0;
}


运行结果:


0b402aea2dd0841e795e60a9746f98b9.png


5.4 练习 4

下列程序的输出结果是什么?


int main()
{
  int i = -20;
  //1000 0000 0000 0000 0000 0000 0001 0100 - 原码
  //1111 1111 1111 1111 1111 1111 1110 1011 - 反码
  //1111 1111 1111 1111 1111 1111 1110 1100 - 补码
  unsigned int j = 10;
  //0000 0000 0000 0000 0000 0000 0000 1010 - 补码
  printf("%d\n", i + j);//-10
  //i + j
  //1111 1111 1111 1111 1111 1111 1111 0110 - 补码
    //打印有符号整形,转化成原码
  //1000 0000 0000 0000 0000 0000 0000 1001
  //1000 0000 0000 0000 0000 0000 0000 1010 - 原码
  return 0;
}


运行结果:

5fba6bd55201aa16aa231deec09d5af0.png



5.5 练习 5

下列程序的输出结果是什么?

int main()
{
  unsigned int i;//恒大于0
  for (i = 9; i >= 0; i--)//死循环
  {
    printf("%u\n", i);
        //9 ~ 0 ~ 超大的值:-1的补码组成的循环
    //-1的补码:1111 1111 1111 1111 1111 1111 1111 1111
        //放到无符号整数中,将-1的补码直接当做原码输出
        //得到超大的值
        Sleep(1000);//程序停止一秒
  }
  return 0;
}

运行结果:


da79cdf810ade3ff533e9600df7cf9c7.png


5.6 练习 6

下列程序的输出结果是什么?


int main()
{
  char a[1000];
  int i;
  for (i = 0; i < 1000; i++)
  {
    a[i] = -1 - i;
        //char取值范围-128 ~ 127
        //当a[i]的值小于-128时,会转化成127并大于0的值,当a[i]=0时,
        //'\0'的ascii码值为0,当strlen进行计算时,计算第一个'\0'前的字符个数
    //数组中元素:-1 , -2 , ... ,-128 , 127, ..., 1, 0...
  }
  printf("%d", strlen(a));
  //求'\0'前字符的个数
    //'\0'的ascii码值为0
}

图解:

6ebb6eebd5c787d9a0b84106e8f1be82.png


运行结果:


f34315a0070452a959aab3472b98086d.png


5.7 练习 7


下列程序的输出结果是什么?


unsigned char i = 0;//0 ~ 255
int main()
{
    int i = 0;
    //0 ~ 255为区间,循环进行这个区间,打印hello world
  for (i = 0; i <= 255; i++)//死循环
  {
    printf("hello worrld\n");
  }
}

运行结果:

c126e51eb0d61cc741eff12a47281888.png




6. 结语

以上就是探索数据的存储(整形篇)的全部内容,如果觉得anduin写的还不错的话,还请一键三连!

我是anduin,一名C语言初学者,我们下期见!


相关文章
|
19天前
|
存储 程序员 编译器
C 语言中的数据类型转换:连接不同数据世界的桥梁
C语言中的数据类型转换是程序设计中不可或缺的一部分,它如同连接不同数据世界的桥梁,使得不同类型的变量之间能够互相传递和转换,确保了程序的灵活性与兼容性。通过强制类型转换或自动类型转换,C语言允许开发者在保证数据完整性的前提下,实现复杂的数据处理逻辑。
|
20天前
|
存储 数据管理 C语言
C 语言中的文件操作:数据持久化的关键桥梁
C语言中的文件操作是实现数据持久化的重要手段,通过 fopen、fclose、fread、fwrite 等函数,可以实现对文件的创建、读写和关闭,构建程序与外部数据存储之间的桥梁。
|
23天前
|
存储 数据建模 程序员
C 语言结构体 —— 数据封装的利器
C语言结构体是一种用户自定义的数据类型,用于将不同类型的数据组合在一起,形成一个整体。它支持数据封装,便于管理和传递复杂数据,是程序设计中的重要工具。
|
29天前
|
存储 编译器 数据处理
C 语言结构体与位域:高效数据组织与内存优化
C语言中的结构体与位域是实现高效数据组织和内存优化的重要工具。结构体允许将不同类型的数据组合成一个整体,而位域则进一步允许对结构体成员的位进行精细控制,以节省内存空间。两者结合使用,可在嵌入式系统等资源受限环境中发挥巨大作用。
57 11
|
2月前
|
存储 C语言 C++
深入C语言,发现多样的数据之枚举和联合体
深入C语言,发现多样的数据之枚举和联合体
深入C语言,发现多样的数据之枚举和联合体
|
2月前
|
存储 C语言
C语言中的浮点数存储:深入探讨
C语言中的浮点数存储:深入探讨
|
2月前
|
存储 C语言
深入C语言内存:数据在内存中的存储
深入C语言内存:数据在内存中的存储
|
2月前
|
C语言
回溯入门题,数据所有排列方式(c语言)
回溯入门题,数据所有排列方式(c语言)
|
19天前
|
存储 C语言 开发者
【C语言】字符串操作函数详解
这些字符串操作函数在C语言中提供了强大的功能,帮助开发者有效地处理字符串数据。通过对每个函数的详细讲解、示例代码和表格说明,可以更好地理解如何使用这些函数进行各种字符串操作。如果在实际编程中遇到特定的字符串处理需求,可以参考这些函数和示例,灵活运用。
39 10
|
19天前
|
存储 程序员 C语言
【C语言】文件操作函数详解
C语言提供了一组标准库函数来处理文件操作,这些函数定义在 `<stdio.h>` 头文件中。文件操作包括文件的打开、读写、关闭以及文件属性的查询等。以下是常用文件操作函数的详细讲解,包括函数原型、参数说明、返回值说明、示例代码和表格汇总。
42 9