前言
所谓基础不牢,地动山摇。笔者作为一个Android开发者,虽然有些NDK相关的开发经验,但是在写C或C++代码的时候总有一种知其然,不知其所以然的感觉。
随着后续可能在项目中使用大量使用C/C++代码,笔者意识到有必要巩固下自己的C/C++的基础,顺道给扫一下以前学习C/C++的时候留下的知识盲区。
后续可能会不定期更新一些自己复习C/C++的简要笔记,这些笔记更多的是自己温习的过程中对某个知识点的加上自己的理解,如有误人子弟,恳请各位手下留情。
字节对齐
对于结构体大小计算这个问题可以说是C/C++基础面试必问的。那么结构体的大小是如何计算的呢?是简单的成员变量大小的累加吗?
显然不是的,在了解结构体的大小计算之前我们先简单了解下字节对齐的相关概念。
CPU为了提高访问数据的效率,使用了字节对齐的策略。那么什么是字节对齐呢?
所谓字节对齐就是给每个基础数据类型变量的起始地址增加一个限制:每个变量的起始地址必须是该变量所占大小的整数倍
。比如一个 int 类型的变量,它占4个字节的大小,所以这个变量的起始地址应该4的倍数,
所以它的起始地址应该是0x00000000
或者0x00000004
或者0x00000008
这样的地址。
结构体大小计算
先看个例子:
// 结构体字节对齐问题,下面的结构体是占5个字节吗?应该是8个字节,sizeof(DataA) 计算得出
struct DataA{
char a;
int b;
};
// 那么DataB又是占几个字节呢?还是8个字节,为什么?
struct DataB{
char a;
char c;
int b;
};
// 那么DataB又是占几个字节呢?12个字节,为什么?
struct DataC{
char a;
int b;
char c;
};
通过上面的例子我们发现,结构体的大小不仅和变量的类型有关,居然还和变量的顺序有关,比如结构体 DataB
和 DataC
起始就是变量的顺序调换了一下,为什么所占的字节就多了呢?
下面我们就来逐个分析下:
首先对于结构体 DataA
char 类型的变量a,占1个字节,按照字节对齐的规则,比如它的地址为0x00000000
,对于变量 int 类型的变量b,因为 int 类型占用的是4个字节,按照字节对齐的原则,
它的地址应该是4的倍数,但是地址0x00000000
已经被变量a占用了,地址0x00000001
到0x00000003
又不符合对齐的规则,所以变量b的地址就是0x00000004
到0x00000007
了。
那么空着的地址0x00000001
到0x00000003
这三个地址怎么处理呢?用空数据填充呗,所以结构体DataA
的地址就是0x00000000
到0x00000007
,占8个字节的大小啦。
对于DataB
,char类型的变量a和c都是占1个字节,所以按照字节对齐的规则,它们的地址为0x00000000
和0x00000001
,对于int类型的变量b,因为占4个字节,所以它的地址还是和DataA
一样为0x00000004
到0x00000007
,
因此DataB
也是占8个字节的大小。
那么对于DataC
呢?首先我们如果把DataC
的c变量去掉的话就是和结构体DataA
一样了,占了8个字节的大小,如果加上char类型变量c呢?因为char类型占1个类型的字节大小,那么DataC
不就是9个字节的大小了吗?怎么就变成了12个字节的大小了?
这是因为结构体的大小计算还有一个规则就是:总字节大小是最大成员变量类型所占字节数的整数倍。
因为DataC
最大的成员类型是int,占用的是4个字节大小,所以总的大小应该是4的倍数,前面计算到DataC
的大小应该是9,但是9不是4的倍数,所以DataC
的字节9之后一个4的倍数,所以DataC
的大小应该是12个字节。
结构体嵌套的大小计算
例如以下的例子,结构体DataD
占的是40个字节的大小,是如何计算呢?
// 占40个字节,怎么算的呢?
struct DataD{
char a;
int b;
char c;
double d;
struct DataC data;
};
对于结构体DataD
最大的变量类型是double,占用8个字节,所以总大小肯定是8的倍数。加入char类型变量a的地址为0x00000000
,那么按照字节对齐的规则int类型的变量b的地址就是0x00000004
到0x00000007
,
char类型的变量c的地址就是0x00000008
,double类型的变量d按照字节大小对齐的规则,那么它的地址应该是0x00000016
到0x00000023
,也就是中间的0x00000009
到0x00000015
需要用空的数据填充。
那么到目前为止如果不计算变量data的大小的话结构体DataD
已经占了24个字节的大小了,前面我已经知道结构体DataC
的大小是12个字节的大小,由于变量data的类型是结构体,不是基本的数据类型,所以结构体DataD
的大小应该是24加结构体DataC
的大小即可
也就是24+12=36个字节的大小,但是36不是8的倍数,因此结构体DataD
的总大小应该是40。
总结
1、按照成员变量基本数据类型占用字节最大的进行字节对齐,也就是总的大小必须是最大的基本类型所占字节大小的整数倍;
2、只按照基本的数据类型去计算,例如前面例子中的结构体DataD
最大的基本数据类型是double,而不是DataC;
3、每个成员变量的起始地址为该变量类型所占内存的整数倍,若不足则不足部分用空数据填充至所占内存的整数倍。