前言
结构体是C语言中自定义类型之一,当内置类型不能满足的时候,我们就可以使用自定义类型,在后续数据结构的学习过程中会遇到很多关于结构体的内容,所以,小编将在学习结构体时的笔记分享一番。
结构体类型
概述
结构体是一个集合,里面的成员变量可以是不同类型的。
声明
struct tag //tag是标签 { member-list; //成员列表 }variable-list; //变量名称
code
struct Stu { char name[20]; //名字 int age; //年龄 float scr; //分数 };
特殊声明
声明结构体的时候,可以不完全声明:
//匿名结构体类型 struct { int a; char b; float c; }x; struct { int a; char b; float c; }a[20],
结构体的自引用
结构体的自引用:在结构体里面包含一个为该结构体本身的成员。
比如,定义一个链表结点:
struct Node { int data; struct Node* next; }; //错误做法: struct Node { int data; struct Node next; };
为什仫错误做法是错误做法?
这里的next是同一结构体类型中的next,next中又有一个next,无限套娃,是不行的。
正确的自引用是,在结构体声明里面包含一个结构体类型的指针。
注意!!
//错误: typedef struct Node { int data; Node* next; }Node; //正确: typedef struct Node { int data; struct Node* next; }Node;
Node是对前⾯的匿名结构体类型的重命名产⽣的,但是在匿名结构体内部提前使⽤Node类型来创建成员变量,这是不⾏的。
结构体变量的创建和初始化
声明的同时定义变量为S1
struct S { int x; int y; }S1;
单独利用类型定义变量
struct S { int x; int y; }; //声明结构体 struct S S2; //定义全局结构体变量 int main() { struct S S3; //定义一个局部结构体变量 return 0; }
结构体初始化
struct S { int x; int y; }s1={0,0}; struct S s2 = {1,2}; //初始化 int main() { struct S s3 = {3,4};//初始化 return 0; }
结构成员访问操作符
结构成员访问操作符有两个⼀个是 . ,⼀个是 -> .
形式:
结构体变量.成员变量名 结构体指针—>成员变量名
code
#include <stdio.h> #include <string.h> struct Stu { char name[15];//名字 int age; //年龄 }; void print_stu(struct Stu s) { printf("%s %d\n", s.name, s.age); } void set_stu(struct Stu* ps) { strcpy(ps->name, "李四"); ps->age = 28; } int main() { struct Stu s = { "张三", 20 }; print_stu(s); set_stu(&s); print_stu(s); return 0; }
输出结果
张三 20 李四 28
结构体内存对齐
code
#include<stdio.h> struct S1 { char a; int c; char b; }; struct S2 { char a; char b; int c; }; int main() { printf("%d\n", sizeof(struct S1)); printf("%d\n", sizeof(struct S2)); return 0; }
输出结果
12 8
为什么呢??
⾸先得掌握结构体的对⻬规则:
- 结构体的第⼀个成员对⻬到相对结构体变量起始位置偏移量为0的地址处
- 其他成员变量要对⻬到某个数字(对⻬数)的整数倍的地址处。
对⻬数 = 编译器默认的⼀个对⻬数 与 该成员变量⼤⼩的较⼩值。
- VS中默认的值为8
- Linux中没有默认对⻬数,对⻬数就是成员⾃⾝的⼤⼩
- 结构体总⼤⼩为最⼤对⻬数(结构体中每个成员变量都有⼀个对⻬数,所有对⻬数中最⼤的)的整数倍。
- 如果嵌套了结构体的情况,嵌套的结构体成员对⻬到⾃⼰的成员中最⼤对⻬数的整数倍处,结构体的整体⼤⼩就是所有最⼤对⻬数(含嵌套结构体中成员的对⻬数)的整数倍。
对上述代码内存进行解析:
struct S1:
这里为struct S1开辟一块空间
首先给char a开辟空间,char a是结构体第一个成员,根据规则:结构体的第⼀个成员对⻬到相对结构体变量起始位置偏移量为0的地址处,即,图中绿色位置
接下来,为第二个成员,int c开辟空间,根据规则: 其他成员变量要对⻬到某个数字(对⻬数)的整数倍的地址处。 这里的c是一个整型变量,自身大小为4,小编编译器是VS2019,默认对齐数为8,根据规则:对⻬数 = 编译器默认的⼀个对⻬数 与 该成员变量⼤⼩的较⼩值。 所以,c的对齐数为4。偏移量1,2,3都不是4的倍数,因此从4开始,开辟4个字节,即图中深红色的位置。
最后为 char b开辟空间,b是一个字符类型变量,自身大小为1,编译器的默认对齐数是8,和开辟 int c 一样,因此b的对齐数是1,偏移量8就是1的倍数,因此从8开始,开辟1个字节,即图中蓝色位置。
从0~8一共,此时结构体9个字节,根据规则:结构体总⼤⼩为最⼤对⻬数(结构体中每个成员变量都有⼀个对⻬数,所有对⻬数中最⼤的)的整数倍。所以需要再浪费几个空间,浪费到偏移量为11时,此时刚好开辟了12(12是4的倍数)个字节。
struct S2:
这里为struct S1开辟一块空间
首先给char a开辟空间,char a是结构体第一个成员,根据规则:结构体的第⼀个成员对⻬到相对结构体变量起始位置偏移量为0的地址处,即,图中绿色位置
接下来,为第二个成员,char b 开辟空间,根据规则: 其他成员变量要对⻬到某个数字(对⻬数)的整数倍的地址处。,这里的b是一个字符类型变量,自身大小为1,VS默认对齐数为8,因此对齐数是1,偏移量1是1的倍数,从1开始开辟1个字节,即图中蓝色位置。
最后为 int c开辟空间,c是整型变量,自身大小为4,VS默认对齐数为8,因此对齐数为4,根据规则: 对⻬数 = 编译器默认的⼀个对⻬数 与 该成员变量⼤⼩的较⼩值。 偏移量2,3都不是4的倍数,从偏移量4开始,开辟4个字节。
此时,struct S2 开辟了8个字节,8是4的倍数,因此不需要再浪费空间了。
内存对齐的原因
参考资料:
- 平台原因(移植原因):
不是所有的硬件平台都能访问任意地址上的任意数据的;某些硬件平台只能在某些地址处取某些特定类型的数据,否则抛出硬件异常。 - 性能原因:
数据结构(尤其是栈)应该尽可能地在⾃然边界上对⻬。原因在于,为了访问未对⻬的内存,处理器需要作两次内存访问;⽽对⻬的内存访问仅需要⼀次访问。假设⼀个处理器总是从内存中取8个字节,则地
址必须是8的倍数。如果我们能保证将所有的double类型的数据的地址都对⻬成8的倍数,那么就可以⽤⼀个内存操作来读或者写值了。否则,我们可能需要执⾏两次内存访问,因为对象可能被分放在两个8字节内存块中。
总体来说:结构体的内存对⻬是拿空间来换取时间的做法。
如何既要满足内存对齐又要节省空间??
让占用空间小的成员在一起
例如:
struct S1 { char c1; int i; char c2; }; //写成: struct S2 { char c1; char c2; int i; };
S1 和 S2 类型的成员⼀模⼀样,但是 S1 和 S2 所占空间的⼤⼩有了⼀些区别
修改默认对齐方式
#pragma 这个预处理指令,可以改变编译器的默认对⻬数。
#include <stdio.h> #pragma pack(1)//设置默认对⻬数为1 struct S { char c1; int i; char c2; }; #pragma pack()//取消设置的默认对⻬数,还原为默认 int main() { //输出的结果是什么? printf("%d\n", sizeof(struct S)); return 0; }
输出结果
6
此时VS默认对齐数为1,int i 的自身大小为4,根据规则:对⻬数 = 编译器默认的⼀个对⻬数 与 该成员变量⼤⼩的较⼩值。 因此,对齐数为1,偏移量1是1的倍数,和上面的一个代码就不一样了。
结构体传参
struct S { int data[1000]; int num; }; struct S s = { {1,2,3,4}, 1000 }; //结构体传参 void print1(struct S s) { printf("%d\n", s.num); } //结构体地址传参 void print2(struct S* ps) { printf("%d\n", ps->num); } int main() { print1(s); //传结构体 print2(&s); //传地址 return 0; }
⾸选print2函数。
原因:
函数传参的时候,参数是需要压栈,会有时间和空间上的系统开销。
如果传递⼀个结构体对象的时候,结构体过⼤,参数压栈的的系统开销⽐较⼤,所以会导致性能的下降。
结论:
结构体传参的时候,要传结构体的地址。