- 基本概念
- 结构体对齐是一种编译器为了提高内存访问效率而采用的内存布局规则。在C语言中,结构体的成员在内存中的存储位置不是随意的,而是按照一定的规则进行对齐排列。
- 对齐规则
- 规则一:数据成员对齐
- 第一个数据成员的地址是结构体变量起始地址偏移量为0的位置。也就是说,第一个成员总是放在结构体开始的地方。例如,有一个简单的结构体
struct S{int a;}
,a
的地址就是结构体S
的起始地址。
- 第一个数据成员的地址是结构体变量起始地址偏移量为0的位置。也就是说,第一个成员总是放在结构体开始的地方。例如,有一个简单的结构体
- 规则二:其他数据成员对齐
- 每个数据成员的起始地址必须是它自身大小或者编译器默认对齐模数(一般是4字节或8字节,具体取决于编译器和平台)的整数倍。例如,在32位系统中,编译器默认对齐模数通常是4字节。如果有一个结构体
struct S{char a; int b;}
,char
类型的a
占1字节,它位于起始位置(偏移量为0),int
类型的b
占4字节,它的起始地址必须是4的倍数。因为a
占了1字节,所以编译器会在a
后面填充3字节,使得b
的起始地址是4的倍数。
- 每个数据成员的起始地址必须是它自身大小或者编译器默认对齐模数(一般是4字节或8字节,具体取决于编译器和平台)的整数倍。例如,在32位系统中,编译器默认对齐模数通常是4字节。如果有一个结构体
- 规则三:结构体整体对齐
- 结构体的总大小必须是结构体中最大数据成员大小或者编译器默认对齐模数(取较大者)的整数倍。例如,对于结构体
struct S{char a; int b;}
,int
是最大的数据成员,占4字节。按照前面的规则,a
占1字节,填充3字节后b
开始存储,b
占4字节,所以结构体S
的大小是8字节,因为要满足是最大成员int
大小(4字节)的整数倍这个条件。
- 结构体的总大小必须是结构体中最大数据成员大小或者编译器默认对齐模数(取较大者)的整数倍。例如,对于结构体
- 规则一:数据成员对齐
- 对齐的原因
- 主要是为了提高CPU的内存访问效率。CPU在读取内存时,每次读取的数据块大小是固定的(例如,32位CPU每次读取4字节,64位CPU每次读取8字节)。如果数据存储是对齐的,CPU可以用一次内存读取操作获取完整的数据,而如果数据存储是不对齐的,可能需要多次读取操作才能获取完整的数据,从而降低了程序的运行效率。
- 修改对齐方式(以编译器指令为例)
- 不同的编译器有不同的方式来修改结构体的对齐方式。在一些编译器中,可以使用
#pragma pack(n)
指令来指定对齐模数n
。例如,#pragma pack(1)
可以让编译器按照1字节对齐,这样结构体就不会有额外的填充字节,但可能会降低内存访问效率。使用#pragma pack()
(没有参数)可以恢复编译器默认的对齐方式。
- 不同的编译器有不同的方式来修改结构体的对齐方式。在一些编译器中,可以使用
通过理解结构体对齐规则,可以更好地控制结构体的内存布局,对于优化程序的内存使用和性能有很大的帮助。