1. 什么是位段
我们使用结构体实现位段,位段的声明和结构体是类似的,有两个不同:
- 位段的成员必须是int,unsigned int,或signed int。(注:只要是整型家族都可以,如char)
- 位段的成员名后面有一个冒号和一个数字。
(注:数字表示该成员所占空间的比特位的多少,并且不能超过该类型的大小。)
比如:
struct A { int _a : 2; int _b : 5; int _c : 10; int _d : 30; };
A就是一个位段类型。
那有人会产生疑问,int不是4个字节,32个比特位吗,怎么_a是2个比特位呢?
解答:int确实是32bit没错,但是:2的意思是_a不需要那么多的空间,只要分配2bit就可以啦。
比如在结构体中我们定义一个变量int flag;只是用来表示真假(0或1),要存一个0或1其实没有必要用一个整型(32bit)来储存的,只需要1bit即可。这时就可以使用位段。
结论:位段是可以节省空间的!!
那位段A的大小是多少呢?
struct A { int _a : 2; int _b : 5; int _c : 10; int _d : 30; }; int main() { printf("%zd\n", sizeof(struct A));//8 return 0; }
有人就开始思考,2+5+10+30=47bit,那么用6byte就可以了。究竟是不是呢,输出结果如下:
所以位段只是在一定的程度上节省空间(本来要16byte,使用位段后只要8byte),并不是那么死板,要知足常乐。
为什么是8byte呢,就需要了解位段的内存分配了。
2. 位段的内存分配
- 位段的成员可以是int,unsigned int,signed int或者char(属于整型家族)类型。
- 位段的空间上是按照需要,以4个字节(int)或是1个字节(char)的方式来开辟的。
- 位段涉及很多不确定因素,位段是不跨平台的,注重可移植的程序应该避免使用位段。
注意:位段成员一般是同类型的,不要把不同类型的混在一起。
举一个例子:
struct S { char a : 3; char b : 4; char c : 5; char d : 4; }; int main() { struct S s = { 0 }; printf("%zd\n", sizeof(struct S)); //在a,b,c,d中放入数据 s.a = 10; s.b = 12; s.c = 3; s.d = 4; return 0; }
首先我们给a开辟8bit(char类型,1byte),a只需要3bit,用后还剩下5bit,b需要4bit,用后还剩下1bit,c需要5bit,此时空间不够用了,又会开辟8bit,这时问题来了,c是从新开辟的8bit开始用,还是仍会使用前面剩下的1bit呢?
如果从新开辟的空间开始用,c用后还剩3bit,d需要4bit,这时空间又不够了,又会开辟8bit,一共开辟了3byte。
但是如果会使用前面剩下的1bit,则再开辟8bit后c,d刚好使用完,一共开辟了2byte。
到底是哪一种情况呢,输出结果如下:
结论:说明浪费了前面那一个bit位。
那么a,b,c,d的数据是如何存放的呢?画图演示:
调试结果如下:
如图所示,说明至少在VS2022编译器上,我们的猜测是正确的。
3. 位段的跨平台问题
- int位段被当成有符号数还是无符号数是不确定的。
(意思是当位段的成员是int时,到底是unsigned int 还是signed int是不确定的)- 位段中最大位的数目不能确定。
(意思是在16位的机器上int最大是2byte,16bit,而在32位机器上是4byte,32bit,如果写成27,在16位的机器上和处问题)- 位段中的成员在内存中从左向右分配还是从右向左分配标准尚未定义。
(由前文可知在VS2022上是从右往左分配的,在其他编译器上不一定)- 当⼀个结构包含两个位段,第⼆个位段成员比较大,无法容纳于第⼀个位段剩余的位时,是舍弃
剩余的位还是利用,这是不确定的。
结论:跟结构相比,位段可以达到同样的效果,并且可以很好的节省空间,但是有跨平台的问题存在。
4. 位段的应用
下图是网络协议中,IP数据报的格式,我们可以看到其中很多的属性只需要几个bit位就能描述,这里使用位段,能够实现想要的效果,也节省了空间,这样网络传输的数据报大小也会较小⼀些,对网络的畅通是有帮助的。
4. 使用位段的注意事项
位段的几个成员共有同⼀个字节,这样有些成员的起始位置并不是某个字节的起始位置,那么这些位置处是没有地址的。内存中每个字节分配⼀个地址,⼀个字节内部的bit位是没有地址的。
所以不能对位段的成员使用&操作符,这样就不能使用scanf直接给位段的成员输入值,只能是先输入
放在⼀个变量中,然后赋值给位段的成员。
struct A { int _b : 5; int _c : 10; int _d : 30; }; int main() { struct A sa = {0}; scanf("%d", &sa._b);//这是错误的 //正确的⽰范 int b = 0; scanf("%d", &b); sa._b = b; return 0; }