详解结构体、位段、枚举、联合类型【C语言/进阶】-阿里云开发者社区

详解结构体、位段、枚举、联合类型【C语言/进阶】

2023-10-23 97 发布于广东

版权

本文内容由阿里云实名注册用户自发贡献，版权归原作者所有，阿里云开发者社区不拥有其著作权，亦不承担相应法律责任。具体规则请查看《阿里云开发者社区用户服务协议》和《阿里云开发者社区知识产权保护指引》。如果您发现本社区中有涉嫌抄袭的内容，填写侵权投诉表单进行举报，一经查实，本社区将立刻删除涉嫌侵权内容。

简介： 详解结构体、位段、枚举、联合类型【C语言/进阶】

前言

这一篇将详细讲解各自自定义类型：结构体、位段、枚举、联合

1. 结构体

基础知识

结构是一些值的集合，这些值被称为成员变量。结构的每个成员可以是不同类型的变量。

1.1 结构体的声明

struct tag
{
member-list;
}variable-list;

如学生类型

struct Stu
{
char name[20];//名字
int age;//年龄
char sex[5];//性别
char id[20];//学号
}s1, s2; //分号不能丢
//s1和s2都是全局变量
//变量s数量至少为0

1.2 特殊类型：匿名结构体类型

在声明时省略了结构体标签（tag）

//例
struct  
{
int a;
char b;
float c;
}x;
struct
{
int a;
char b;
float c;
}*p;

问：以上述代码为例，以下代码合法吗？

p = &x;

非法：

虽然它们都没有标签，且即使结构成员相同，但编译器依然会认为它们是两个不同的类型。所以编译器很有可能会提示警告。

1.3 结构自引用

即在a结构中的一个成员也是a结构本身

首先以一个例子说明结构自引用的作用

//代码1
struct Node
{
int data;
struct Node next;
};
//可行否？
//如果可以，那sizeof(struct Node)是多少？

结果

不可行，这类似一个递归，结构Node永远不会初始化完整，因为每次遇到第二条语句都会重新创建一个结构体，所以这是不被语法允许的。

正确引用

//代码2
struct Node
{
int data;
struct Node* next;
};

如何理解？

在结构体Node中，不仅包含了数据，还包含了上一个部分的地址，*仅代表next是一个结构体指针，以表示它是能存放地址的。

typedef 的使用注意事项

typedef struct即重命名结构体。（typedef + xx = 重命名xx）以下的例子是将struct Node重命名为最后分号前的Node

标准写法：

typedef struct Node
{
int data;
struct Node* next;
}Node;//代码3

所以只要typedef struct即重命名结构体以后，再需要定义结构体时便不再需要写struct，使用起来更简便。如

Node a = {{ },{ }};

typedef struct
{
int data;
Node* next;
}Node;
//这样在结构体定义一个结构体，可以吗？

答案是不行。编译器按从上到下的顺序执行语句，当这整个语句是在重命名结构体，但结构体内部在未重命名时就使用了重命名后的结构体变量名，这是非法的。

1.4 结构体变量初始化

前面已经介绍，在此处给出整体代码

struct Point
{
int x;
int y;
}p1; //声明类型的同时定义变量p1
struct Point p2; //定义结构体变量p2
//初始化：定义变量的同时赋初值。
struct Point p3 = {x, y};
struct Stu //类型声明
{
char name[15];//名字
int age; //年龄
};
struct Stu s = {"zhangsan", 20};//初始化
struct Node
{
int data;
struct Point p;
struct Node* next;
}n1 = {10, {4,5}, NULL}; //结构体嵌套初始化
struct Node n2 = {20, {5, 6}, NULL};//结构体嵌套初始化

1.5 结构体内存对齐

这个问题许多学校老师包括众多教材都是一笔略过，但这里的知识点蛮重要的。

首先以结构体的大小为例：

struct S1
{
char c1;
int i;
char c2;
};
struct S2
{
char c1;
char c2;
int i;
};
//以下结果是如何呢？两个一样的吗？
int main()
{
  printf("%d\n", sizeof(struct S1));
  printf("%d\n", sizeof(struct S2));
  return 0;
}

结果

为什么两个结构体的成员相同，只是顺序不同，它们的大小不应该是一样的吗，为什么这里不一样？

在我们了解了结构体内存对齐后，我们就会理解了

首先掌握结构体的对齐规则：

第一个成员在与结构体变量偏移量为0的地址处。
按顺序，其他成员变量要对齐到对齐数的整数倍的偏移量对应的地址处。
对齐数 = 编译器内置的一个数值与该成员大小的较小值。
（VS编译器中默认的值为8；Linux中没有默认值，则对齐数就是成员大小本身）
结构体总大小为最大对齐数（每个成员变量都有一个对齐数）的整数倍。
对于结构体嵌套的情况，嵌套的结构体要对齐到自己的最大对齐数的整数倍处，结构体的整体大小就是所有最大对齐数（含嵌套结构体的每个对齐数）的整数倍

#include<stdio.h>
struct S1
{
  char c1;
  int i;
  char c2;
};
struct S2
{
  char c1;
  struct S1 s1;
  double d;
};
//以下结果是如何呢？
int main()
{
  printf("%d\n", sizeof(struct S2));
  return 0;
}

结构体内存对齐的意义何在？

平台原因(移植原因)：
不是所有的硬件平台都能访问任意地址上的任意数据的；某些硬件平台只能在某些地址处取某些特定类型的数据，否则有硬件异常的错误信息。
性能原因：
数据结构(尤其是栈)应该尽可能地在自然边界上对齐。
原因在于：为了访问未对齐的内存，处理器需要作两次内存访问；而对齐的内存访问仅需要一次访问。

总体来说：

结构体的内存对齐是拿空间来换取时间的做法。

所以在定义结构体时，尽量将同类型的且长度小的变量放在一起。

1.7 修改默认对齐数

默认对齐数是可以修改的

使用#pragma 这个预处理指令，可以改变默认对齐数

#include <stdio.h>
#pragma pack(8)//设置默认对齐数为8
struct S1
{
  char c1;
  int i;
  char c2;
};
#pragma pack()//取消设置的默认对齐数，还原为默认
#pragma pack(1)//设置默认对齐数为1
struct S2
{
  char c1;
  int i;
  char c2;
};
#pragma pack()//取消设置的默认对齐数，还原为默认
int main()
{
  //输出的结果是什么？
  printf("%d\n", sizeof(struct S1));
  printf("%d\n", sizeof(struct S2));
  return 0;
}

结果

1.8 结构体传参

传参的目的是什么？

在函数中我们使用了传值和传址，二者最大的不同是前者的形参是实参的一份临时拷贝，后者是间接寻址，直接操作原数据。后者能提高程序的效率。

struct S
{
int data[1000];
int num;
};
struct S s = {{1,2,3,4}, 1000};
//结构体传参
void print1(struct S s)
{
printf("%d\n", s.num);
}
//结构体地址传参
void print2(struct S* ps)
{
printf("%d\n", ps->num);
}
int main()
{
print1(s); //传结构体
print2(&s); //传地址
return 0;
}

问：应该选择print1还是print2？

print2

原因：

函数传参的时候，参数是需要压栈，会有时间和空间上的系统开销。

当要传递一个结构体对象时，若结构体体积过大，每次调用它时都要重新为它开辟一次内存空间，参数压栈的系统开销就会比较大，所以会导致性能的下降。

总结：

结构体的大小往往不会很小，所以为了提高程序性能，在传参时应该传址。

2. 位段

又叫位域。它是用结构体实现的，但区别于结构体

它充分利用空间，弥补了内存对齐造成的内存浪费这个缺点。例如：我传递的多个信息都很小，只有几个比特位那么大，如果为每个信息都开辟一个字节的空间，这样会浪费很多超过信息本身的空间，位段就是让这些长度很短的信息尽可能地放在一起，节省空间。这个例子下面会介绍。

2.1 什么是位段

1.位段的成员必须是int、char、unsigned int 或signed int 。

2.位段的成员名后边有一个冒号和一个数字。数字是比特位。

例如

A是一个位段类型

struct A
{
  int a : 2;//成员a占2个bit位
  int b : 5;//成员b占5个bit位
  int c : 10;
  int d : 30;
};

位段的大小

int main()
{
  printf("%d\n", sizeof(struct A));
  return 0;
}

2.2 位段的内存分配

位段的成员可以是int unsigned 、int signed 、int 或者是char （整型家族）类型
位段的空间上是按照需要以4个字节（ int ）或者1个字节（ char ）的方式来开辟的。
位段涉及很多不确定因素，所以位段是不跨平台的，注重可移植的程序应该避免使用位段。

//一个例子
struct S
{
  char a : 3;
  char b : 4;
  char c : 5;
  char d : 4;
};

2.3 位段的跨平台问题

int 位段被当成有符号数还是无符号数是不确定的。
位段中最大位的数目不能确定。（16位机器最大16，32位机器最大32，如果是27，在16位机器会出问题。
位段中的成员在内存中从左向右分配，还是从右向左分配，标准尚未定义。
当一个结构包含两个位段，第二个位段成员比较大，无法容纳于第一个位段剩余的位时，是弃剩余的位还是利用，这是不确定的。

总结

跟结构体相比，位段可以达到同样的效果，但是可以很好的节省空间，但是有跨平台的问题存在。

2.4 位段的应用

主机与主机之间传输数据时会将IP数据报一起打包，以实现信息匹配的目的，然而网路带宽是有限的，而且要传递的信息不止一种，且每种信息并不是很长，也各不相同，所以如果用char、int变量来存储这些碎片信息，是浪费空间的。所以人们利用位段，将一个字节的32个bit位分为若干部分，每个部分存放不同的信息，这样就实现了节省空间的效果。

3. 枚举

枚举就是对一个变量取任何有可能的值，如：月份有12个月；颜色有很多种等等

3.1 枚举类型的定义

enum Day//星期
{
Mon,
Tues,
Wed,
Thur,
Fri,
Sat,
Sun
};
enum Sex//性别
{
MALE,
FEMALE,
SECRET
}；
enum Color//颜色
{
RED,
GREEN,
BLUE
};

以上定义的enum Day ， enum Sex ， enum Color 都是枚举类型。

{}中的内容是枚举类型的可能取值，也叫枚举常量。

这些可能取值都是有值的，默认从0开始，一次递增1，当然在定义的时候也可以赋初值。

例如：

enum Color//颜色
{
RED=1,
GREEN=2,
BLUE
};

当然，使用#define宏定义这些都是可以的，实际上枚举的出现就是为了简化#define的使用。那么枚举有什么用呢？

3.2 枚举的优点

我们可以使用#define 定义常量，为什么要使用枚举？

枚举的优点：

增加代码的可读性和可维护性。也就是说，常量不仅仅是某个数值，枚举赋予它名字，使得程序可读性提高。
和#define定义的标识符不同，枚举有类型检查，更加严谨。例如在C++文件中：
防止了命名污染（封装），即将所有枚举值都封装在一个枚举类型中
便于调试。
使用方便，一次可以定义多个常量。相当于同时使用多个宏定义

3.3 枚举的使用

enum Color//颜色
{
RED=1,
GREEN=2,
BLUE=4
};
enum Color clr = GREEN;//只能拿枚举常量给枚举变量赋值，才不会出现类型的差异。

4. 联合（共用体）

4.1 联合类型的定义

联合也是一种特殊的自定义类型

这种类型定义的变量也包含一系列的成员，特征是这些成员共用同一块空间（所以联合也叫共用体）。

比如：

//联合类型的声明
union Un
{
char c;
int i;
};
//联合变量的定义
union Un un;
//计算两个变量的大小
printf("%d\n", sizeof(un));

//联合类型的声明
union Un
{
  char c;
  int i;
};
int main()
{
  //联合变量的定义
  union Un un;
  //打印联合变量、每个成员的地址
  //注意这里访问成员的方式
  printf("%p\n", &un);
  printf("%p\n", &un.c);
  printf("%p\n", &un.i);
  return 0;
}

这两个结果都出人意料，为什么呢？

4.2 联合的特点

联合的成员是共用同一块内存空间的，这样一个联合变量的大小，至少是最大成员的大小（因为联合至少得保存最大的成员）。

一道面试题

//判断大小端函数
int f()
{
  union Un
  {
    char c;
    int i;
  }u;
  u.i = 1;
  return u.c;
}
int main()
{
  if (1 == f())
  {
    printf("小端\n");
  }
  else
  {
    printf("大端\n");
  }
  return 0;
}

友情链接：大小端介绍（第二点）

4.3 联合大小的计算

联合的大小至少是最大成员的大小。

当最大成员大小不是最大对齐数的整数倍的时候，就要对齐到最大对齐数的整数倍。

union Un1
{
char c[5];
int i;
};
union Un2
{
short c[7];
int i;
};
//下面输出的结果是什么？
printf("%d\n", sizeof(union Un1));
printf("%d\n", sizeof(union Un2));

试着以上面的思路分析一下吧:D

结语

自定义类型是今后数据结构的基础，它是数据结构中常用的类型。各自自定义类型相似，但使用语法要注意，在学习过程中不要忘记动手。

欢迎指正！

如果你有收获的话，不妨给作者一个鼓励吧~

详解结构体、位段、枚举、联合类型【C语言/进阶】

前言

1. 结构体

基础知识

1.1 结构体的声明

1.2 特殊类型：匿名结构体类型

1.3 结构自引用

1.4 结构体变量初始化

1.5 结构体内存对齐

1.7 修改默认对齐数

1.8 结构体传参

2. 位段

2.1 什么是位段

2.2 位段的内存分配

2.3 位段的跨平台问题

2.4 位段的应用

3. 枚举

3.1 枚举类型的定义

3.2 枚举的优点

3.3 枚举的使用

4. 联合（共用体）

4.1 联合类型的定义

4.2 联合的特点

4.3 联合大小的计算

结语

热门文章

最新文章

相关课程

相关电子书

相关实验场景

探索云世界

热门

云计算

大数据

云原生

人工智能

数据库

开发与运维

活动广场

任务中心

开发者评测

高校计划

乘风者计划

训练营

阿里云MVP

话题

直播

下载

镜像站

技术资料

插件

详解结构体、位段、枚举、联合类型【C语言/进阶】

前言

1. 结构体

基础知识

1.1 结构体的声明

1.2 特殊类型：匿名结构体类型

1.3 结构自引用

1.4 结构体变量初始化

1.5 结构体内存对齐

1.7 修改默认对齐数

1.8 结构体传参

2. 位段

2.1 什么是位段

2.2 位段的内存分配

2.3 位段的跨平台问题

2.4 位段的应用

3. 枚举

3.1 枚举类型的定义

3.2 枚举的优点

3.3 枚举的使用

4. 联合（共用体）

4.1 联合类型的定义

4.2 联合的特点

4.3 联合大小的计算

结语

热门文章

最新文章

相关课程

相关电子书

相关实验场景