1.结构的基础知识
我们之前简单介绍过结构体,可以保存不同数据类型。
我们基本数据类型有int 、 char、 double、 short 等等,但是这并不能满足形容所有事物。 比如修饰一个人,一本书,我们只用基本类型去形容是不够的,所以引出了结构体。
对于一本书,它需要有书名,作者,编号,价格等等,我们对这些书的基本属性,称之为成员变量,而这些变量的集合,称之为结构。结构的每个成员可以是不同类型的变量。
2. 结构的声明
struct tag
{
member-list;
}variable-list;
比如描述一个学生:
struct Stu { char name[20];//名字 int age;//年龄 char sex[5];//性别 char id[20];//学号 }; //分号不能丢
我们来区别一个直接在结构体后面加上结构体名和在主函数中创建变量名。
#include <stdio.h> struct Stu { char name[20]; int age; char sex[5]; char id[20]; }stu1,stu2;//是Stu的结构体变量,也是全局变量 int main() { struct Stu stu3;//只是局部变量 return 0; }
3. 特殊的声明
在声明结构的时候,可以不完全的声明。
例如:
//匿名结构体类型 struct { int a; char b; float c; }x; struct { int a; char b; float c; }a[20], *p;
我们一般的struct 后面都要加一个名字,表示结构体名,但是上述情况可以省略结构体名,这种叫做匿名结构体。
写匿名结构体时,必须要赋一个结构体变量,否则编译器会报错。
上面的两个结构在声明的时候省略掉了结构体标签( tag )。
那么问题来了:
p = &x; // 这样的代码合法吗?
结果如上图,虽然编译器没有报错,但是它给了警告,根据警告说明了,两个匿名结构体哪怕结构体成员变量都一样,但是却不是同一个结构体。
所以是非法的。
4. 结构的自引用
在结构中包含一个类型为该结构本身的成员是否可以呢?
struct Node
{
int data ;
struct Node next ;
};
// 可行否?
如果可以,那 sizeof ( struct Node ) 是多少?
我拿本地编译器试试看结构:
我们可以看见,它连编译都过不去。
我们先了解一下链表:
链表是数据结构的知识:一般我们人为得将链表分为两个区域,一个叫做数据域,用于存放数据;另一个叫做指针域,用于连接下一个链表;我们就通过链表的指针域去访问后面的数据。
如图所示:
回到我们这道例题:我们每个Node中都还有一个Node,每一个都有,哪到什么时候才结束呢,计算机也不知道,所以编译通不过。
正确的自引用方式:
struct Node { int data; struct Node* next; };
5. 结构体变量的定义和初始化
有了结构体类型,那如何定义变量,其实很简单。
上代码:
struct Point { int x; int y; }p1; //声明类型的同时定义变量p1 struct Point p2; //定义结构体变量p2 //初始化:定义变量的同时赋初值。 struct Point p3 = { x, y }; struct Stu //类型声明 { char name[15];//名字 int age; //年龄 }; struct Stu s = { "zhangsan", 20 };//初始化 struct Node { int data; struct Point p; struct Node* next; }n1 = { 10, {4,5}, NULL }; //结构体嵌套初始化 struct Node n2 = { 20, {5, 6}, NULL };//结构体嵌套初始化
6. 结构体内存对齐
我们已经掌握了结构体的基本使用了。
现在我们深入讨论一个问题:计算结构体的大小。
这是本章的重点内容:
我们先来看几个例子:
//练习1 struct S1 { char c1; int i; char c2; }; printf("%d\n", sizeof(struct S1));
我们来看看他的结构未多少:
它的结构居然为12,char和int类型怎么算也算不到吧。
再看一个例子:
#include <stdio.h> struct S2 { char c1; char c2; int i; }; int main() { printf("%d\n", sizeof(struct S2)); return 0; }
我们只是改变了它的一个位置,结构好像又不一样了。
首先得掌握结构体的对齐规则:
1. 第一个成员在与结构体变量偏移量为 0 的地址处。
2. 其他成员变量要对齐到某个数字(对齐数)的整数倍的地址处。
对齐数 = 编译器默认的一个对齐数 与 该成员大小的 较小值 。
VS 中默认的值为 8
3. 结构体总大小为最大对齐数(每个成员变量都有一个对齐数)的整数倍。
4. 如果嵌套了结构体的情况,嵌套的结构体对齐到自己的最大对齐数的整数倍处,结构体的整
体大小就是所有最大对齐数(含嵌套结构体的对齐数)的整数倍。
那好,我们根据对齐规则简单说明一下:
拿第一个例子说明,我们第一个成员变量是从偏移量为0的位置开始的,char占了一个字节,向后移动到下表为1的偏移量处,判断1是否为int类型的整数倍,不是再向下移动;直到4的偏移量初,再放下int;这时偏移量来到了8的位置,8时char类型的整数倍,所以char就放在了8的位置。
那么我们总共占了9个字节,9不是int类型的整数倍,又要向后浪费几个字节的空间。
所以结构就为12。
画图演示:
其实对于结构体变量相对于偏移量的起始位置的计算,我们有个专门的宏:offsetof 。
同理:
这是第二题的图示。
为什么存在内存对齐 ?
官方没有解释,大部分的参考资料都是如是说的:
1. 平台原因 ( 移植原因 ) :
不是所有的硬件平台都能访问任意地址上的任意数据的;某些硬件平台只能在某些地址处取某些特
定类型的数据,否则抛出硬件异常。
2. 性能原因 :
数据结构 ( 尤其是栈 ) 应该尽可能地在自然边界上对齐。
原因在于,为了访问未对齐的内存,处理器需要作两次内存访问;而对齐的内存访问仅需要一次访
问。
总体来说:
结构体的内存对齐是拿 空间 来换取 时间 的做法。
那在设计结构体的时候,我们既要满足对齐,又要节省空间,如何做到:
让占用空间小的成员尽量集中在一起。
S1 和 S2 类型的成员一模一样,但是 S1 和 S2 所占空间的大小有了一些区别。
7. 修改默认对齐数
之前我们见过了 #pragma 这个预处理指令,这里我们再次使用,可以改变我们的默认对齐数
#include <stdio.h> #include <stdio.h> #pragma pack(8)//设置默认对齐数为8 struct S1 { char c1; int i; char c2; }; #pragma pack()//取消设置的默认对齐数,还原为默认 #pragma pack(1)//设置默认对齐数为1 struct S2 { char c1; int i; char c2; }; #pragma pack()//取消设置的默认对齐数,还原为默认 int main() { //输出的结果是什么? printf("%d\n", sizeof(struct S1)); printf("%d\n", sizeof(struct S2)); return 0; }
我们看看这个结果如何:
结论:
结构在对齐方式不合适的时候,我么可以自己更改默认对齐数。
8. 结构体传参
#include <stdio.h> struct S { int data[1000]; int num; }; struct S s = { {1,2,3,4}, 1000 }; //结构体传参 void print1(struct S s) { printf("%d\n", s.num); } //结构体地址传参 void print2(struct S* ps) { printf("%d\n", ps->num); } int main() { print1(s);//传结构体 print2(&s); //传地址 return 0; }
上面的 print1 和 print2 函数哪个好些?
答案是:首选 print2 函数。
原因:
函数传参的时候,参数是需要压栈,会有时间和空间上的系统开销。
如果传递一个结构体对象的时候,结构体过大,参数压栈的的系统开销比较大,所以会导致性能的
下降。