【C语言】自定义类型:结构体深入解析(二)结构体内存对齐&&宏offsetof计算偏移量&&结构体传参

本文涉及的产品
云解析 DNS,旗舰版 1个月
全局流量管理 GTM,标准版 1个月
公共DNS(含HTTPDNS解析),每月1000万次HTTP解析
简介: 【C语言】自定义类型:结构体深入解析(二)结构体内存对齐&&宏offsetof计算偏移量&&结构体传参

📝前言

本小节,我们学习结构的内存对齐,理解其对齐规则,内存对齐包含结构体的计算,使用宏offsetof计算偏移量,为什么要存在内存对齐?最后了解结构体的传参文章干货满满!学习起来吧😃!

🌠 结构体内存对齐

结构体内存对齐指的是结构体中各成员变量在内存中的存储位置按照一定规则对齐。

既然是按照一定规则,那得首先了解它的对齐规则:


  1. 结构体的第一个成员对齐到和结构体起始位置偏移量为0的地址处。
  2. 其他成员变量要对齐到某个数字(对齐数)的整数倍的地址处。

对齐数 = 编译器默认的一个对齐数 与 该成员变量大小的较小值。

  • VS 中默认的值为 8
  • linuxgcc没有默认对齐数,对齐数就是成员自身的大小
  1. 结构体总大小为最大对齐数(结构体中的每一个成员都有一个对齐数,所有对齐数中的)的整数倍。
  2. 如果嵌套了结构体的情况,嵌套的结构体成员对齐到自己的成员中最大对齐数的整数倍处,结构体的整体大小就是所有最大对齐数(含嵌套结构体中成员的对齐数)的整数倍。
  • 来代码理解:
struct S1
{
  char c1;
  char c2;
  int i;
};

struct S2
{
  char c1;
  int i;
  char c2;
};

int main()
{
  printf("%d\n", sizeof(struct S1));
  printf("%d\n", sizeof(struct S2));

  return 0;
}

代码运行:

分析:

首先结构体S1的成员有三个,根据对齐规则:结构体的第一个成员对齐到结构体变量起始位置偏移量为0的地址处-—>C1放在偏移量为0的地址处,接下来第二个C2就从第2个规则按对齐数进行放置,C2的字节数char类型,大小为1,VS的默认对齐数为8,对齐数取的是默认对齐数和成员变量字节大小的较小值,1<8,取1为对齐数,然后偏移量为1的位置放1,此时再看第三个变量i的字节大小为4,4<8,对齐数为4,当放在偏移量为2时,2不是4的整数倍,跳过,3也不是,跳过,而当偏移量为4时刚好是4的整数1倍(4*1=4),然后占据为4个字节空间,从偏移量0到最后偏移量的空间就是结构体的总大小,为8,此时还没有结束,要验证,根据第三条规则结构体的总大小为最大对齐数的整数倍,最大对齐数为4(4>1>1),而结构刚才计算出来是8刚好是4整数倍(4*2)当这些都符合了,结构体的大小就是8了。


一个例子你可能想是不是碰巧,那么第二个例子:

结构体S2中有三个成员,C1大小为一,第一个成员放在偏移量为0处,第二个成员i大小为4,偏移量1,2,3都不是4的整数倍,然后这些空间都跳过不放数据,(注:他开辟了空间,但他此时不用,你可能会想:这不浪费吗?文章我们慢慢解释)然后偏移量为4时为整数倍,从偏移量4开始放i直到7,第三个元素C2大小为1,1的整数倍任何数的整数倍,可以直接放,当放在偏移量8处时,全部成员都放完了,我们还要对他进行验证是否为整数倍。S2最大对齐数是4,偏移量9,10都不对,当偏移量为11,从0到11刚好为12,为4的倍数(4*3=12)。所以S2总大小为12!


🌉内存对齐包含结构体的计算

struct S3
{
  double d;
  char c;
  int i;
};
int main()
{
  printf("%zd\n", sizeof(struct S3));
  return 0;
}
运行结果:16

分析:

首先第一个成员为d,放在偏移量为0处,double类型,大小为8,位置范围为0 ~ 7,第二个成员C ,类型为char,大小为1,1<8,对齐数为1,1可以直接放,占据8位置处,第三个成员i,大小为4,4<8,对齐数是4,偏移量9,10,11都不是4的倍数,12开始占据4个空间到15,范围0 ~ 15总大小为16。S3结构体是三个成员(8>4>1)大小最大是double大小为8,此时总结构体大小16刚好为8的2倍,符合条件。

首先第一个成员为d,放在偏移量为0处,double类型,大小为8,位置范围为0 ~ 7,第二个成员C ,类型为char,大小为1,1<8,对齐数为1,1可以直接放,占据8位置处,第三个成员i,大小为4,4<8,对齐数是4,偏移量9,10,11都不是4的倍数,12开始占据4个空间到15,范围0 ~ 15总大小为16。S3结构体是三个成员(8>4>1)大小最大是double大小为8,此时总结构体大小16刚好为8的2倍,符合条件。

  • [] 包含S3的结构体
struct S4
{
  char c1;
  struct S3 s3;
  double d;
};

int main()
{
  printf("%zd\n", sizeof(struct S4));

  return 0;
}
运行结果:32

第一个成员C1对应到偏移量为0处,大小为1,s3为结构体,s3的大小为16,根据第四条规则【如果嵌套了结构体的情况,嵌套的结构体成员对齐到自己的成员中最大对齐数的整数倍处,结构体的整体大小就是所有最大对齐数(含嵌套结构体中成员的对齐数)的整数倍。】,也就是说结构体s3最大对齐数为double的8,用8对齐到S4中整数倍,1,2,3,4,5,6,7都不是8的整数倍,跳过,当偏移量为8时为对齐数8的整数倍时,然后结构体整体大小为16,占据范围为8 ~ 23,接下来就是第三个元素d,大小为8,偏移量24就是8的整数倍,占据了24 ~ 31,所有成员都完成了,偏移量范围在0 ~ 31,总大小就是32。答案就是32.看到这里的你,给自己鼓个掌,继续加油。

🌠宏offsetof计算偏移量

offsetof可以用来计算结构体成员相对于结构体起始位置的偏移量。

offsetof原型:

offsetof(type, member)
type是结构体类型
member是结构体中的成员。

注意:使用offsetof宏计算结构体成员偏移量时,需要包含stddef.h头文件

# define _CRT_SECURE_NO_WARNINGS 1
#include <stdio.h>
#include <string.h>
#include <stddef.h>
struct S1
{
  char c1;
  char c2;
  int i;
};

struct S2
{
  char c1;
  int i;
  char c2;
};

struct S3
{
  double d;
  char c;
  int i;
};

struct S4
{
  char c1;
  struct S3 s3;
  double d;
};

int main()
{
  struct S1 s1 = {0};//8
  struct S2 s2 = { 0 };//12

  printf("结构体大小:\n");
  printf("S1=%zd\n", sizeof(struct S1));//8
  printf("S2=%zd\n", sizeof(struct S2));//12
  printf("S3=%zd\n", sizeof(struct S3));//16
  printf("S4=%zd\n", sizeof(struct S4));//32
  printf("\n"); 
  printf("结构体S1成员的偏移量:\n");
  printf("c1=%zd\n", offsetof(struct S1, c1));//0
  printf("c2=%zd\n", offsetof(struct S1, c2));//1
  printf(" i=%zd\n", offsetof(struct S1, i));//8
  printf("\n");
  printf("结构体S2成员的偏移量:\n");
  printf("c1=%zd\n", offsetof(struct S2, c1));//0
  printf(" i=%zd\n", offsetof(struct S2, i));//4
  printf("c2=%zd\n", offsetof(struct S2, c2));//8
  printf("\n");
  printf("结构体S4成员的偏移量:\n");
  printf("c1=%zd\n", offsetof(struct S4, c1));//0
  printf("s3=%zd\n", offsetof(struct S4, s3));//8
  printf("d=%zd\n", offsetof(struct S4, d));//24

  return 0;
}

运行+图对比:

🌉为什么存在内存对⻬?

1.平台原因 (移植原因):

不是所有的硬件平台都能访问任意地址上的任意数据的;某些硬件平台只能在某些地址处取某些特定类型的数据,否则抛出硬件异常。

2.性能原因:

数据结构(尤其是栈)应该尽可能地在⾃然边界上对⻬。原因在于,为了访问未对⻬的内存,处理器需要作两次内存访问;⽽对⻬的内存访问仅需要⼀次访问。

假设⼀个处理器总是从内存中取8个字节,则地址必须是8的倍数。如果数据没有对齐,CPU需要额外的时间来处理非对齐的内存访问,这会降低性能。

总结一句话来说:

结构体的内存对⻬是拿空间来换取时间的做法。

在设计结构体时,既要满足内存对齐要求,又要考虑节省空间,可以采取以下方法:

  • 尽量将较小类型如charshort等成员放在结构体开始位置。这可以减少由对齐产生的内存浪费。
  • 例如前面的S1S2就很典型:
struct S1
{
 char c1;
 int i;
 char c2;
};
struct S2
{
 char c1;
 char c2;
 int i;
};

阿森把宝图解:

  • 修改默认对⻬数
    #pragma 这个预处理指令,可以改变编译器的默认对⻬数。
    #pragma 原型:
#pragma pack(push, 1) // 将结构体对齐数设置为1字节 
struct S1
{
  char a; 
  int b;
};
#pragma pack(pop)// 恢复之前的对齐数
  • pack(push, 1)表示将当前对齐数压入栈,并设置新的对齐数为1字节
  • pack(pop)表示从栈中弹出之前的对齐数,恢复默认对齐数

可以直接指定对齐数:

#pragma pack(1) 
struct S1
{       // 成员对齐数为1字节
  char a; 
  int b;
};

#pragma pack() // 恢复默认对齐数

例子:

#pragma pack(1)
struct S1
{
  char c1;
  char c2;
  int i;
};
#pragma pack()


int main()
{
  printf("%d\n", sizeof(struct S1));
  return 0;
}

输出:

图解对比:

🌠 结构体传参

  1. 按值传递(传结构体)
    函数形参声明为结构体,实参传递结构体变量。此时在函数内对形参的修改不会影响实参。
struct St 
{
  int x;
};

void func(struct St st) 
{
  st.x = 10;
}

int main() 
{
  struct St s = { 0 };
  func(s);//传结构体
  printf("%d\n", s.x);
}

输出:

  1. 按地址传递
    函数形参定义为结构体指针,实参传递结构体变量的地址。函数内对形参所指结构体的修改会影响实参。
struct St 
{
  int x;
};

void func(struct St* p) 
{
  p->x = 10;
}

int main() {
  struct St s = { 0 };
  func(&s);
  printf("%d\n", s.x);
}

输出:

  1. 传结构体指针
    实参直接传结构体指针:
struct St 
{
  int x;
};

void func(struct St* st) 
{
  st->x = 10;
}

int main() 
{
  struct St s;
  struct St* p = &s;
  func(p);
  printf("%d\n", s.x);
}

输出:10

分析:

传值也就是把整个结构体传过去,我们知道形参是是实参的一份临时拷贝,需要再创建特别大的空间来存储结构体。

无论是传结构体指针还是传结构体地址,本质上都是传地址,但是传地址,只需要创建一个小的空间来存储地址。

选择传地址比较好一些。

原因:

函数传参的时候,参数是需要压栈,会有时间和空间上的系统开销。
如果传递⼀个结构体对象的时候,结构体过⼤,参数压栈的的系统开销⽐较⼤,所以会导致性能的下降。

总结:

结构体传参的时候,要传结构体的地址。


🚩总结

这次阿森和你一起学习结构体的 结构体内存对齐,内存对齐包含结构体的计算,使用宏offsetof计算偏移量,为什么存在内存对⻬? 结构体传参的本质,阿森将下一节和你一起学习结构体实现位段。


感谢你的收看,如果文章有错误,可以指出,我不胜感激,让我们一起学习交流,如果文章可以给你一个小小帮助,可以给博主点一个小小的赞😘

相关文章
|
1月前
|
数据采集 存储 JavaScript
如何使用Cheerio与jsdom解析复杂的HTML结构进行数据提取
在现代网页开发中,复杂的HTML结构给爬虫技术带来挑战。传统的解析库难以应对,而Cheerio和jsdom在Node.js环境下提供了强大工具。本文探讨如何在复杂HTML结构中精确提取数据,结合代理IP、cookie、user-agent设置及多线程技术,提升数据采集的效率和准确性。通过具体示例代码,展示如何使用Cheerio和jsdom解析HTML,并进行数据归类和统计。这种方法适用于处理大量分类数据的爬虫任务,帮助开发者轻松实现高效的数据提取。
如何使用Cheerio与jsdom解析复杂的HTML结构进行数据提取
|
28天前
|
存储 编译器 程序员
C语言程序的基本结构
C语言程序的基本结构包括:1)预处理指令,如 `#include` 和 `#define`;2)主函数 `main()`,程序从这里开始执行;3)函数声明与定义,执行特定任务的代码块;4)变量声明与初始化,用于存储数据;5)语句和表达式,构成程序基本执行单位;6)注释,解释代码功能。示例代码展示了这些组成部分的应用。
41 10
|
26天前
|
C语言
C语言程序设计核心详解 第四章&&第五章 选择结构程序设计&&循环结构程序设计
本章节介绍了C语言中的选择结构,包括关系表达式、逻辑表达式及其运算符的优先级,并通过示例详细解释了 `if` 语句的不同形式和 `switch` 语句的使用方法。此外,还概述了循环结构,包括 `while`、`do-while` 和 `for` 循环,并解释了 `break` 和 `continue` 控制语句的功能。最后,提供了两道例题以加深理解。
|
26天前
|
存储 算法 C语言
数据结构基础详解(C语言): 二叉树的遍历_线索二叉树_树的存储结构_树与森林详解
本文从二叉树遍历入手,详细介绍了先序、中序和后序遍历方法,并探讨了如何构建二叉树及线索二叉树的概念。接着,文章讲解了树和森林的存储结构,特别是如何将树与森林转换为二叉树形式,以便利用二叉树的遍历方法。最后,讨论了树和森林的遍历算法,包括先根、后根和层次遍历。通过这些内容,读者可以全面了解二叉树及其相关概念。
|
26天前
|
C语言
C语言程序设计核心详解 第三章:顺序结构,printf(),scanf()详解
本章介绍顺序结构的基本框架及C语言的标准输入输出。程序从`main()`开始依次执行,框架包括输入、计算和输出三部分。重点讲解了`printf()`与`scanf()`函数:`printf()`用于格式化输出,支持多种占位符;`scanf()`用于格式化输入,需注意普通字符与占位符的区别。此外还介绍了`putchar()`和`getchar()`函数,分别用于输出和接收单个字符。
|
26天前
|
存储 机器学习/深度学习 C语言
数据结构基础详解(C语言): 树与二叉树的基本类型与存储结构详解
本文介绍了树和二叉树的基本概念及性质。树是由节点组成的层次结构,其中节点的度为其分支数量,树的度为树中最大节点度数。二叉树是一种特殊的树,其节点最多有两个子节点,具有多种性质,如叶子节点数与度为2的节点数之间的关系。此外,还介绍了二叉树的不同形态,包括满二叉树、完全二叉树、二叉排序树和平衡二叉树,并探讨了二叉树的顺序存储和链式存储结构。
|
2月前
|
存储 缓存 NoSQL
深入解析Memcached:内部机制、存储结构及在大数据中的应用
深入解析Memcached:内部机制、存储结构及在大数据中的应用
|
2月前
|
程序员 C语言
位操作在C语言中的解析与应用
位操作在C语言中的解析与应用
75 0
|
2月前
|
存储 缓存 算法
深入解析B树:数据结构、存储结构与算法优势
深入解析B树:数据结构、存储结构与算法优势
|
2月前
|
存储 监控 算法
深入解析JVM内部结构及GC机制的实战应用
深入解析JVM内部结构及GC机制的实战应用

推荐镜像

更多
下一篇
无影云桌面