重温C与C++之结构体大小计算

简介: C++进阶之结构体大小计算

前言

所谓基础不牢,地动山摇。笔者作为一个Android开发者,虽然有些NDK相关的开发经验,但是在写C或C++代码的时候总有一种知其然,不知其所以然的感觉。

随着后续可能在项目中使用大量使用C/C++代码,笔者意识到有必要巩固下自己的C/C++的基础,顺道给扫一下以前学习C/C++的时候留下的知识盲区。

后续可能会不定期更新一些自己复习C/C++的简要笔记,这些笔记更多的是自己温习的过程中对某个知识点的加上自己的理解,如有误人子弟,恳请各位手下留情。

字节对齐

对于结构体大小计算这个问题可以说是C/C++基础面试必问的。那么结构体的大小是如何计算的呢?是简单的成员变量大小的累加吗?

显然不是的,在了解结构体的大小计算之前我们先简单了解下字节对齐的相关概念。

CPU为了提高访问数据的效率,使用了字节对齐的策略。那么什么是字节对齐呢?

所谓字节对齐就是给每个基础数据类型变量的起始地址增加一个限制:每个变量的起始地址必须是该变量所占大小的整数倍。比如一个 int 类型的变量,它占4个字节的大小,所以这个变量的起始地址应该4的倍数,
所以它的起始地址应该是0x00000000或者0x00000004或者0x00000008这样的地址。

结构体大小计算

先看个例子:

// 结构体字节对齐问题,下面的结构体是占5个字节吗?应该是8个字节,sizeof(DataA) 计算得出
struct DataA{
    char a;
    int b;
};

// 那么DataB又是占几个字节呢?还是8个字节,为什么?
struct DataB{
    char a;
    char c;
    int b;
};

// 那么DataB又是占几个字节呢?12个字节,为什么?
struct DataC{
    char a;
    int b;
    char c;
};

通过上面的例子我们发现,结构体的大小不仅和变量的类型有关,居然还和变量的顺序有关,比如结构体 DataBDataC
起始就是变量的顺序调换了一下,为什么所占的字节就多了呢?

下面我们就来逐个分析下:

首先对于结构体 DataA char 类型的变量a,占1个字节,按照字节对齐的规则,比如它的地址为0x00000000,对于变量 int 类型的变量b,因为 int 类型占用的是4个字节,按照字节对齐的原则,
它的地址应该是4的倍数,但是地址0x00000000已经被变量a占用了,地址0x000000010x00000003又不符合对齐的规则,所以变量b的地址就是0x000000040x00000007了。
那么空着的地址0x000000010x00000003这三个地址怎么处理呢?用空数据填充呗,所以结构体DataA的地址就是0x000000000x00000007,占8个字节的大小啦。

DataA的内存地址分布

对于DataB,char类型的变量a和c都是占1个字节,所以按照字节对齐的规则,它们的地址为0x000000000x00000001,对于int类型的变量b,因为占4个字节,所以它的地址还是和DataA一样为0x000000040x00000007
因此DataB也是占8个字节的大小。

那么对于DataC呢?首先我们如果把DataC的c变量去掉的话就是和结构体DataA一样了,占了8个字节的大小,如果加上char类型变量c呢?因为char类型占1个类型的字节大小,那么DataC不就是9个字节的大小了吗?怎么就变成了12个字节的大小了?

这是因为结构体的大小计算还有一个规则就是:总字节大小是最大成员变量类型所占字节数的整数倍。

因为DataC最大的成员类型是int,占用的是4个字节大小,所以总的大小应该是4的倍数,前面计算到DataC的大小应该是9,但是9不是4的倍数,所以DataC的字节9之后一个4的倍数,所以DataC的大小应该是12个字节。

结构体嵌套的大小计算

例如以下的例子,结构体DataD占的是40个字节的大小,是如何计算呢?

// 占40个字节,怎么算的呢?
struct DataD{
    char a;  
    int b;   
    char c;  
    double d; 
    struct DataC data;
};

对于结构体DataD最大的变量类型是double,占用8个字节,所以总大小肯定是8的倍数。加入char类型变量a的地址为0x00000000,那么按照字节对齐的规则int类型的变量b的地址就是0x000000040x00000007
char类型的变量c的地址就是0x00000008,double类型的变量d按照字节大小对齐的规则,那么它的地址应该是0x000000160x00000023,也就是中间的0x000000090x00000015需要用空的数据填充。

那么到目前为止如果不计算变量data的大小的话结构体DataD已经占了24个字节的大小了,前面我已经知道结构体DataC的大小是12个字节的大小,由于变量data的类型是结构体,不是基本的数据类型,所以结构体DataD的大小应该是24加结构体DataC的大小即可
也就是24+12=36个字节的大小,但是36不是8的倍数,因此结构体DataD的总大小应该是40。

总结

1、按照成员变量基本数据类型占用字节最大的进行字节对齐,也就是总的大小必须是最大的基本类型所占字节大小的整数倍;
2、只按照基本的数据类型去计算,例如前面例子中的结构体DataD最大的基本数据类型是double,而不是DataC;
3、每个成员变量的起始地址为该变量类型所占内存的整数倍,若不足则不足部分用空数据填充至所占内存的整数倍。

目录
相关文章
|
4月前
|
C++
C++ 根据程序运行的时间和cpu频率来计算在另外的cpu上运行所花的时间
C++ 根据程序运行的时间和cpu频率来计算在另外的cpu上运行所花的时间
50 0
|
4月前
|
C++
c++学习笔记07 结构体
C++结构体的详细学习笔记07,涵盖了结构体的定义、使用、数组、指针、嵌套、与函数的交互以及在结构体中使用const的示例和解释。
40 0
|
6月前
|
安全 编译器 C++
C++一分钟之-编译时计算:constexpr与模板元编程
【6月更文挑战第28天】在C++中,`constexpr`和模板元编程用于编译时计算,提升性能和类型安全。`constexpr`指示编译器在编译时计算函数或对象,而模板元编程通过模板生成类型依赖代码。常见问题包括误解constexpr函数限制和模板递归深度。解决策略包括理解规则、编写清晰代码、测试验证和适度使用。通过实战示例展示了如何使用`constexpr`计算阶乘和模板元编程计算平方。
101 13
|
3月前
|
存储 算法 C++
【C++核心】结构体、共用体详解
这篇文章详细讲解了C++中结构体和共用体的概念、定义、使用场景和案例,包括结构体的创建、数组、指针、嵌套、函数参数传递,以及共用体的特点和应用实例。
42 4
|
3月前
|
C++
继续更新完善:C++ 结构体代码转MASM32代码
继续更新完善:C++ 结构体代码转MASM32代码
|
4月前
|
C++
C++ PCL 计算多个RT矩阵变换后的变换矩阵
C++ PCL 计算多个RT矩阵变换后的变换矩阵
55 0
|
4月前
|
C++
C++代码来计算一个点围绕另一个点旋转45度后的坐标
C++代码来计算一个点围绕另一个点旋转45度后的坐标
101 0
|
5月前
|
机器学习/深度学习 算法 C++
C++多态崩溃问题之为什么在计算梯度下降时需要除以批次大小(batch size)
C++多态崩溃问题之为什么在计算梯度下降时需要除以批次大小(batch size)
|
4月前
|
C++ 容器
C++中自定义结构体或类作为关联容器的键
C++中自定义结构体或类作为关联容器的键
47 0
|
5月前
|
C++ 开发者
C++一分钟之-编译时计算:constexpr与模板元编程
【7月更文挑战第2天】C++的`constexpr`和模板元编程(TMP)实现了编译时计算,增强代码效率。`constexpr`用于声明编译时常量表达式,适用于数组大小等。模板元编程则利用模板进行复杂计算。常见问题包括编译时间过长、可读性差。避免方法包括限制TMP使用,保持代码清晰。结合两者可以解决复杂问题,但需明确各自适用场景。正确使用能提升代码性能,但需平衡复杂性和编译成本。
141 3