1 引言
结构体是c语言中非常重要的一种数据结构,它在原有的基本数据类型的基础上,开发者可以扩展新的数据类型,使得结构体在日常的开发中使用非常频繁,因此有必要了解关于结构体的一切知识,尤其是哪些冷门的、平时接触的比较少的知识更加值得关注。
而在实际开发过程中,比较常见的场景是给定结构体变量的初始地址,如何访问结构体内每一个成员变量?这类问题的核心是如何快速的计算结构体成员变量的偏移地址。本文将和大家一起探讨结构体内成员变量偏移计算的相关知识。
2 结构体偏移问题及计算方法
首先来看下面的一个计算结构体偏移量的问题。
已知结构体类型定义如下:
struct node_t{ char a; int b; int c; };
且结构体1Byte对齐
#pragma pack(1)
求结构体struct node_t中成员变量c的偏移(这里的偏移量指的是相对于结构体起始位置的偏移量)。
看到这个问题的时候,相信不同的人脑中浮现的解决方法可能会有所差异,下面将分析几种可能的解法:
解法一
如果你对c语言的库函数比较熟悉的话,那么你第一个想到的肯定是offsetof函数(其实只是个宏而已,先姑且这样叫着吧),我们man 3 offsetof查看函数原型如下:
#include <stddef.h> size_t offsetof(type, member);
有了上述的库函数,用一行代码就可以搞定:
offsetof(struct node_t, c);
当然这并非本文探讨的重点,请继续阅读。
解法二
当我们对c语言的库函数不熟悉的时候,此时也不要着急,依然可以使用我们自己的方法来解决问题。
最直接的思路是:【结构体成员变量c的地址】 减去 【结构体起始地址】
先来定义一个结构体变量node:
struct node_t node;
接着来计算成员变量c的偏移量:
(unsigned long)(&(node.c)) - (unsigned long)(&node)
&(node.c)为结构体成员变量c的地址,并强制转化为unsigned long;
&node为结构体的起始地址,也强制转化为unsigned long;
最后将上述两值相减,得到成员变量c的偏移量;
解法三
按照解法二的思路在不借助库函数的情况下,可以得到成员变量c的偏移量。但作为程序员,应该善于思考,是不是可以针对上面的代码做一些改进,使代码变得更简洁一些?在做具体的改进之前,需要分析解法二存在的问题是什么。
相信不用我多说,细心的你一定已经察觉到,方法2中最主要的一个问题是我们自定义了一个结构体变量node,虽然题目中并未限制我们可以自定义变量,但当我们遇到比较严且题目中不允许自定义变量的时候,此时我们就要思考新的解决方法。
在探讨新的解决方法之前,先来探讨一个有关偏移的小问题:
几何小问题
这是一道简单的几何问题,假设在座标轴上由A点移动到B点,如何计算B相对于A的偏移?
这个问题对于我们来说是非常的简单,可能大部分人都会脱口而出并得到答案为B-A。
那么这个答案是否完全准确呢?比较严谨的你觉得显然不是,原因在于,当A为坐标原点即A=0的时候,上述答案B-A就直接简化为B了。
这个小小的简单的问题,对于我们来说有什么启示呢?
结合方法2的思路和上述的小问题,是不是很快就得到了下面的关联:
(unsigned long)(&(node.c)) - (unsigned long)(&node)
和
B - A
我们小问题的思路是当A为坐标原点的时候,B-A就简化为B了,那么对应到我们的方法2,当node的内存地址为0即(&node==0)的时候,上面的代码可简化为:
(unsigned long)(&(node.c))
由于node内存地址==0了,所以
node.c //结构体node中成员变量c
我们就可以使用另外一种方式来表达了,如下:
((struct node_t *)0)->c
上述代码应该比较好理解,由于我们知道结构体的内存地址编号为0,所以我们就可以直接通过内存地址的方式来访问该结构体的成员变量,相应的代码的含义就是 获取内存地址编号为0的结构体struct node_t的成员变量c。
注:此处只是利用了编译器的特性来计算结构体偏移,并未对内存地址0有任何操作,有些同学对此可能还有些疑问,详细的了解该问题可参考关于c语言结构体成员变量访问方式的一点思考。
此时,我们的偏移求法就消除了struct node_t node这个自定义变量,直接一行代码解决,:
(unsigned long)(&(((struct node_t *)0)->c))
上述的代码相对于方法2是不是更简洁了一些。
这里我们将上面的代码功能定义为一个宏,该宏的作用是用来计算某结构体内成员变量的偏移(后面的示例会使用该宏):
#define OFFSET_OF(type, member) (unsigned long)(&(((type *)0)->member))
使用上面的宏,就可以直接得到成员变量c在结构体struct node_t中的偏移为:
OFFSET_OF(struct node_t, c)
3 结论
本文为大家介绍了一种新的c语言中结构体成员变量偏移计算方法,该方法计算量小,且较一般的方法相比,最大的优势在于不需要定义一个结构体变量,就可以直接计算其偏移量。
参考文献
[1] http://isis.poly.edu/kulesh/stuff/src/klist/
[2] https://www.kernel.org/doc/Documentation/CodingStyle
[3] http://www.kroah.com/log/linux/container_of.html