结构体
结构是一些值的集合,这些值称为成员变量。结构的每个成员可以是不同类型的变量。
结构的声明
struct tag { member-list; }variable-list;
例如描述一个学生:
struct Stu { char name[20];//名字 int age;//年龄 char sex[5];//性别 char id[20];//学号 }; //分号不能丢
struct Stu { char name[20];//名字 int age;//年龄 char sex[5];//性别 char id[20];//学号 }s1,s2; //分号不能 s1和s2是struct Stu变量
也可以在直接用stryct Stu定义一个变量,如:struct Stu a
匿名结构体类型
struct { int a; char b; float c; }x;
匿名结构体变量,不能像前面那样用struct+类型名+名字 创建变量,因此匿名结构体类型只能使用一次,意思是在声明的时候可以创建变量,声明结束后就不能创建变量
struct { int a; char b; float c; }a[20], *p;
a里面可以放20个匿名结构体数据,*和结构体类型组合起来叫结构体指针,定义了一个变量p,组合起来就是匿名结构体类型的指针变量
p = &x;
虽然x和p的成员一模一样,但是这里会出错,编译器会认为是俩种完全不同的类型
结构体的自引用
struct Node { int data; //数据 struct Node next; //下一个节点 }; //可行否?
如果可以,那sizeof(struct Node)是多少?
这种方式是错误的,计算不出节点大小,因为下一个节点里面又包含一个新的节点,会无线套娃
struct Node { int data; struct Node* next; };
这种方法是正确的,应放下一个节点的地址
typedef struct { int data; Node* next; }Node;
给匿名结构体类型重新安一个名字叫Node,这种写法也是错误的,这里不能确定是现有Node还是先有Node*
解决方案
typedef struct Node { int data; struct Node* next; }Node;
先有名字,然后有这个Node类型,struct Node n1=Node n1
结构体变量的定义和初始化
struct Point { int x; int y; }p1; //声明类型的同时定义变量p1 struct Point p2; //定义结构体变量p2 //初始化:定义变量的同时赋初值。 struct Point p3 = {x, y}; struct Stu //类型声明 { char name[15];//名字 int age; //年龄 }; struct Stu s = {"zhangsan", 20};//初始化
struct Node { int data; struct Point p; struct Node* next; }n1 = {10, {4,5}, NULL}; //结构体嵌套初始化 struct Node n2 = {20, {5, 6}, NULL};//结构体嵌套初始化
结构体内存对齐
结构体内存对齐规则:1. 第一个成员在与结构体变量偏移量为0的地址处。
2. 其他成员变量要对齐到某个数字(对齐数)的整数倍的地址处。
对齐数 = 编译器默认的一个对齐数 与 该成员大小的较小值。
VS中默认的值为8,默认对齐数只有vs有
3. 结构体总大小为最大对齐数(每个成员变量都有一个对齐数)的整数倍。
4. 如果嵌套了结构体的情况,嵌套的结构体对齐到自己的最大对齐数的整数倍处,结构体的整体大小就是所有最大对齐数(含嵌套结构体的对齐数)的整数倍。
#include<stdio.h> #include<string.h> struct S1 { char c1; int i; char c2; }; int main() { printf("%d", sizeof(struct S1)); return 0; }
C1的对齐数是1:VS默认的对齐数是8,char的大小是1字节,1小于8,所以c1的对齐数是1
i的对齐数是4,c2的对齐数也是1
这里c2填到8这里之后,结构体总大小为0-8也就是9,9不是该结构体最大对齐数4的整数倍,因此要找到一个数,使0-该数是最大对齐数的整数倍
因此多申请了几个空间,使其偏移量为0-11,刚好12个字节,使4的整数倍,只不过申请的这些空间会被浪费掉
#include<stdio.h> #include<string.h> struct S2 { char c1; char c2; int i; }; int main() { printf("%d", sizeof(struct S2)); return 0; }
0-7,总字节大小是8
如何查看偏移量
offsetof (宏)第一个参数是结构体类型,第二个参数是结构体成员,返回值是该成员在结构体中的偏移量,头文件
以第一题为例子
结构体嵌套问题
#include<stdio.h> #include<string.h> #include<stddef.h> struct S3 { double d; char c; int i; }; int main() { printf("%d\n", sizeof(struct S3)); return 0; }
0-15,刚好16个字节是8的整数倍
struct S3 { double d; char c; int i; }; struct S4 { char c1; struct S3 s3; double d; }; int main() { printf("%d\n", sizeof(struct S4)); return 0; }
结构体内存对齐规则:1. 第一个成员在与结构体变量偏移量为0的地址处。
2. 其他成员变量要对齐到某个数字(对齐数)的整数倍的地址处。
对齐数 = 编译器默认的一个对齐数 与 该成员大小的较小值。
VS中默认的值为8,默认对齐数只有vs有
3. 结构体总大小为最大对齐数(每个成员变量都有一个对齐数)的整数倍。
4. 如果嵌套了结构体的情况,嵌套的结构体对齐到自己的最大对齐数的整数倍处,结构体的整体大小就是所有最大对齐数(含嵌套结构体的对齐数)的整数倍。
c1的对齐数为1,S3的对齐数为它自己最大的对齐数,所以s3最大的对齐数是8,但s3大小为16个字节,double d的大小为8个字节,对齐数为8个字节,
0-31是32个比特位,是最大对齐数的整数倍
为什么存在内存对齐?
1. 平台原因(移植原因):
不是所有的硬件平台都能访问任意地址上的任意数据的;某些硬件平台只能在某些地址处取某些特定类型的数据,否则抛出硬件异常。
2. 性能原因:
数据结构(尤其是栈)应该尽可能地在自然边界上对齐。
原因在于,为了访问未对齐的内存,处理器需要作两次内存访问;而对齐的内存访问仅需要一次访问。
总体来说:结构体的内存对齐是拿空间来换取时间的做法。
在32位机器上一次可以访问32个比特位,4个字节,若没有对齐,访问i,需要访问俩次
若对齐,则可以跳过前面四个字节,一次性将i的4个字节访问完
那在设计结构体的时候,我们既要满足对齐,又要节省空间,如何做到:
让占用空间小的成员尽量集中在一起
struct S1 { char c1; int i; char c2; }; struct S2 { char c1; char c2; int i; };
S1和S2类型的成员一模一样,但是S1和S2所占空间的大小有了一些区别
修改默认对齐数
之前我们见过了 #pragma 这个预处理指令,这里我们再次使用,可以改变我们的默认对齐数
#include <stdio.h> #pragma pack(8)//设置默认对齐数为8 struct S1 { char c1; int i; char c2; }; #pragma pack()//取消设置的默认对齐数,还原为默认 #pragma pack(1)//设置默认对齐数为1 struct S2 { char c1; int i; char c2; }; #pragma pack()//取消设置的默认对齐数,还原为默认 int main() { //输出的结果是什么? printf("%d\n", sizeof(struct S1)); printf("%d\n", sizeof(struct S2)); return 0; }
#pragma once防止头文件被多次引用
结构体传参
struct S { int data[1000]; int num; }; struct S s = {{1,2,3,4}, 1000}; //结构体传参 void print1(struct S s) { printf("%d\n", s.num); } //结构体地址传参 void print2(struct S* ps) { printf("%d\n", ps->num); } int main() { print1(s); //传结构体 print2(&s); //传地址 return 0; }
上面的 print1 和 print2 函数哪个好些?P2
函数传参的时候,参数是需要压栈,会有时间和空间上的系统开销。
如果传递一个结构体对象的时候,结构体过大,参数压栈的的系统开销比较大,所以会导致性能的下降。
位段
位段的声明和结构是类似的,有两个不同:
1.位段的成员必须是 int、unsigned int 或signed int 。
2.位段的成员名后边有一个冒号和一个数字。
struct A { int _a:2; int _b:5; int _c:10; int _d:30; };
冒号后面的数字代表比特位,如int_a:2 _a此时占2个比特位
位段是用来节省空间的
位段的内存分配
1. 位段的成员可以是 int unsigned int signed int 或者是 char (属于整形家族)类型
2. 位段的空间上是按照需要以4个字节( int )或者1个字节( char )的方式来开辟的。
3. 位段涉及很多不确定因素,位段是不跨平台的,注重可移植的程序应该避免使用位段。
位段是如何分配的
struct S { char a : 3; char b : 4; char c : 5; char d : 4; }; int main() { struct S s = { 0 }; s.a = 10; s.b = 12; s.c = 3; s.d = 4; return 0; }
给a分配了3个比特位的空间,所以我们先开辟一个字节的空间来存储a,a=10,a的二进制1010,但是只有三个比特位,所以a只能保存010
b需要4个比特位,b=12,12的二进制1100,a刚才用了3个比特位还剩5个,所以不用给b再开辟一个新的字节,而是用刚才剩余的空间
c5个比特位,c=3,3的二进制011,刚才剩的空间不够所以给3要开辟一个新的字节
3占5个比特位,d占4个比特位,刚才空间又不够,继续开辟给d一个新的字节,d=4,4的二进制0100
接下来我们看内存
这是在一个字节内部,不考虑大小端问题
位段的跨平台问题
1. int 位段被当成有符号数还是无符号数是不确定的。
2. 位段中最大位的数目不能确定。(16位机器最大16,32位机器最大32,写成27,在16位机器会出问题。
3. 位段中的成员在内存中从左向右分配,还是从右向左分配标准尚未定义。
4. 当一个结构包含两个位段,第二个位段成员比较大,无法容纳于第一个位段剩余的位时,是舍弃剩余的位还是利用,这是不确定的。
总结:
跟结构相比,位段可以达到同样的效果,但是可以很好的节省空间,但是有跨平台的问题在