结构体
结构是一些值的集合,这些值称为成员变量。结构的每个成员可以是不同类型的变量。
1.结构体的声明
之前我们已经简单地了解了结构体的内容了,现在我们先来回顾一下。
声明格式:
struct tag { member-list; }variable-list;
例如描述一个学生:
struct Stu { char name[20];//名字 int age;//年龄 char sex[5];//性别 char id[20];//学号 }; //分号不能丢
在声明结构的时候,我们可以不完全声明,我们通常称这样的结构体为匿名结构体。
//匿名结构体类型 struct { int a; char b; float c; }x; struct { int a; char b; float c; }a[20], *p;
上面的两个结构在声明的时候省略掉了结构体标签(tag)。需要注意的是,匿名结构体只能用一次。现在有一个问题:在上面代码的基础上,下面的代码合法吗?
p = &x;
其实,这样的代码是不合法的。因为编译器会把上面的两个声明当成两个完全不同的类型。
2.结构的自引用
讲结构体的自引用之前,我们先来了解一下结构的嵌套。看下方的代码。
struct A { int a; char c; }; struct B { char c; struct A sa; double d; }; //结构体B中嵌套着结构体A
那么结构的自引用也能够很好地理解,就是结构体自己嵌套这自己。那大家看下方的代码是否能行呢?
struct Node { int data; struct Node next; };
相信大家很容易就能够发现,这个结构体会无限地递归下去,然后它所占的内存会无限大。那么,很明显这种自引用的方式是不对的。
正确的自引用:
struct Node { int data; struct Node* next; };
我们要知道,正确的结构体自引用是包含同类型的结构体指针,而不是同类型的结构体。知道了这个后,让我们来看看下面的代码是否正确?
typedef struct { int data; Node* next; }Node;
其实,这种方法是不正确的。因为在自定义类型名还未生效之前,你就使用自定义类型名来定义变量了。正确的方式应该是这样:
typedef struct Node { int data; struct Node* next; }Node;
3.结构体变量的定义和初始化
struct Point { int x; int y; }p1; //声明类型的同时定义变量p1 struct Point p2 = { 9, 9 }; //定义结构体变量p2 //初始化:定义变量的同时赋初值。 struct Stu //类型声明 { char name[15];//名字 int age; //年龄 }; struct Stu s1 = { "zhangsan", 20 };//初始化 struct Stu s2 = { .age = 18, .name = "lisi" }; struct Node { int data; struct Point p; struct Node* next; }n1 = { 10, {4,5}, NULL }; //结构体嵌套初始化 struct Node n2 = { 20, {5, 6}, NULL };//结构体嵌套初始化
打印结构体变量 :
#include <stdio.h> struct Stu { char name[20];//名字 int age;//年龄 char sex[10];//性别 char id[20];//学号 }; int main() { struct Stu s1 = { "JOY.",23,"FEMALE",202100202020 }; printf("name:%s age:%d sex:%s id:%s\n", s1.name, s1.age, s1.sex, s1.id); return 0; }
4.结构体内存对齐
我们现在已经掌握了结构体的基本使用了。现在我们来深入讨论一个问题,那就是结构体的大小。讲这个之前,我们先来看几道练习。
#include <stdio.h> struct S1 { char c1; int i; char c2; }; struct S2 { char c1; char c2; int i; }; int main() { printf("%d\n", sizeof(struct S1)); printf("%d\n", sizeof(struct S2)); return 0; }
大家可以想一下输出结果会是什么?上面的两个结构体除了里面的成员顺序不一样,其它的都是一样的,那么它们的大小会不会是一样的呢?我们来看一下下方的输出结果。
输出结果:
我们可以看到,结构体struct S1的大小是12个字节,而结构体struct S2却是8个字节。这是为什么呢?这就需要知道结构体内存对齐了。首先我们得掌握结构体的内存对齐规则:
第一个成员在与结构体变量偏移量为0的地址处。
其他成员变量要对齐到某个数字(对齐数)的整数倍的地址处。
对齐数 = 编译器默认的一个对齐数与该成员大小的较小值。
VS中默认的值为8,Linux环境默认不设对齐数(对齐数是结构体成员的自身大小)。
结构体总大小为最大对齐数(每个成员变量都有一个对齐数)的整数倍。
如果嵌套了结构体的情况,嵌套的结构体对齐到自己的最大对齐数的整数倍处,结构体的整体大小就是所有最大对齐数(含嵌套结构体的对齐数)的整数倍。
结构体成员为数组时,该结构体成员的对齐数为默认对齐数与该数组元素类型大小的较小值。
知道了结构体的内存对齐规则之后,我们再来看一下上面的两道练习题。
在前面,我们已经学习到了结构体嵌套的知识。那么,现在我们就来计算一下结构体嵌套的内存大小。请看下方的代码:
#include <stdio.h> struct S3 { double d; //8 char c; //1 int i;//4 }; //struct S3的大小是16个字节 struct S4 { char c1; //1 struct S3 s3;//8 struct S3的最大对齐数为8 double d;//8 }; int main() { printf("%d\n", sizeof(struct S3)); printf("%d\n", sizeof(struct S4)); return 0; }
代码解释:
其实我们通过上面的例子可以看出,结构体的内存对齐是存在一定的内存浪费的。那为什么内存对齐还要存在呢?
平台原因(移植原因):不是所有的硬件平台都能访问任意地址上的任意数据的;某些硬件平台只能在某些地址处取某些特定类型的数据,否则抛出硬件异常。
性能原因:数据结构(尤其是栈)应该尽可能地在自然边界上对齐。原因在于,为了访问未对齐的内存,处理器需要作两次内存访问;而对齐的内存访问仅需要一次访问。
总体来说:结构体的内存对齐是拿空间来换取时间的做法。
那我们在设计结构体的时候,我们肯定既要满足对齐,又要节省空间。那如何做到呢?那就是让占用空间小的成员尽量集中在一起 。
举个例子:
struct S1 { char c1; int i; char c2; };//12 struct S2 { char c1; char c2; int i; };//8 #include <stdio.h> int main() { printf("%d\n", sizeof(struct S1)); printf("%d\n", sizeof(struct S2)); return 0; }
5.修改默认对齐数
在前面,我们已经讲到VS的默认对齐数是8。其实默认对齐数是可以修改的,我们需要借助#pragma这个预处理指令。
代码示例:
#include <stdio.h> #pragma pack(2) //设置默认对齐数为2 struct S1 { char c1; int i; char c2; //默认对齐数为8时,struct S1的大小为12 }; #pragma pack() //恢复默认对齐数 int main() { printf("%d\n", sizeof(struct S1)); //默认对齐数为2时,struct S2的大小为8 return 0; }
注意:当结构在对齐方式不合适时,我们可以自己修改默认对齐数。