【C语言】:探索位段的秘密

简介: 【C语言】:探索位段的秘密

1. 什么是位段

我们使用结构体实现位段,位段的声明和结构体是类似的,有两个不同:

  1. 位段的成员必须是int,unsigned int,或signed int。(注:只要是整型家族都可以,如char)
  2. 位段的成员名后面有一个冒号和一个数字。
    (注:数字表示该成员所占空间的比特位的多少,并且不能超过该类型的大小。)

比如:

struct A
{
  int _a : 2;
  int _b : 5;
  int _c : 10;
  int _d : 30;
};

A就是一个位段类型。

那有人会产生疑问,int不是4个字节,32个比特位吗,怎么_a是2个比特位呢?

解答:int确实是32bit没错,但是:2的意思是_a不需要那么多的空间,只要分配2bit就可以啦。

比如在结构体中我们定义一个变量int flag;只是用来表示真假(0或1),要存一个0或1其实没有必要用一个整型(32bit)来储存的,只需要1bit即可。这时就可以使用位段。

结论:位段是可以节省空间的!!

那位段A的大小是多少呢?

struct A
{
  int _a : 2;
  int _b : 5;
  int _c : 10;
  int _d : 30;
};
int main()
{
  printf("%zd\n", sizeof(struct A));//8
  return 0;
}

有人就开始思考,2+5+10+30=47bit,那么用6byte就可以了。究竟是不是呢,输出结果如下:

所以位段只是在一定的程度上节省空间(本来要16byte,使用位段后只要8byte),并不是那么死板,要知足常乐。

为什么是8byte呢,就需要了解位段的内存分配了。

2. 位段的内存分配

  1. 位段的成员可以是int,unsigned int,signed int或者char(属于整型家族)类型。
  2. 位段的空间上是按照需要,以4个字节(int)或是1个字节(char)的方式来开辟的。
  3. 位段涉及很多不确定因素,位段是不跨平台的,注重可移植的程序应该避免使用位段。

注意:位段成员一般是同类型的,不要把不同类型的混在一起

举一个例子:

struct S
{
  char a : 3;
  char b : 4;
  char c : 5;
  char d : 4;
};
int main()
{
  struct S s = { 0 };
  printf("%zd\n", sizeof(struct S));
  //在a,b,c,d中放入数据
  s.a = 10;
  s.b = 12;
  s.c = 3;
  s.d = 4;
  return 0;
}

首先我们给a开辟8bit(char类型,1byte),a只需要3bit,用后还剩下5bit,b需要4bit,用后还剩下1bit,c需要5bit,此时空间不够用了,又会开辟8bit,这时问题来了,c是从新开辟的8bit开始用,还是仍会使用前面剩下的1bit呢?

如果从新开辟的空间开始用,c用后还剩3bit,d需要4bit,这时空间又不够了,又会开辟8bit,一共开辟了3byte。

但是如果会使用前面剩下的1bit,则再开辟8bit后c,d刚好使用完,一共开辟了2byte。

到底是哪一种情况呢,输出结果如下:

结论:说明浪费了前面那一个bit位

那么a,b,c,d的数据是如何存放的呢?画图演示:

调试结果如下:

如图所示,说明至少在VS2022编译器上,我们的猜测是正确的。

3. 位段的跨平台问题

  1. int位段被当成有符号数还是无符号数是不确定的。
    (意思是当位段的成员是int时,到底是unsigned int 还是signed int是不确定的)
  2. 位段中最大位的数目不能确定。
    (意思是在16位的机器上int最大是2byte,16bit,而在32位机器上是4byte,32bit,如果写成27,在16位的机器上和处问题)
  3. 位段中的成员在内存中从左向右分配还是从右向左分配标准尚未定义
    (由前文可知在VS2022上是从右往左分配的,在其他编译器上不一定)
  4. 当⼀个结构包含两个位段,第⼆个位段成员比较大,无法容纳于第⼀个位段剩余的位时,是舍弃
    剩余的位还是利用,这是不确定的。

结论:跟结构相比,位段可以达到同样的效果,并且可以很好的节省空间,但是有跨平台的问题存在。

4. 位段的应用

下图是网络协议中,IP数据报的格式,我们可以看到其中很多的属性只需要几个bit位就能描述,这里使用位段,能够实现想要的效果,也节省了空间,这样网络传输的数据报大小也会较小⼀些,对网络的畅通是有帮助的。

4. 使用位段的注意事项

位段的几个成员共有同⼀个字节,这样有些成员的起始位置并不是某个字节的起始位置,那么这些位置处是没有地址的。内存中每个字节分配⼀个地址,⼀个字节内部的bit位是没有地址的

所以不能对位段的成员使用&操作符,这样就不能使用scanf直接给位段的成员输入值,只能是先输入
放在⼀个变量中,然后赋值给位段的成员。

struct A
{
 int _b : 5;
 int _c : 10;
 int _d : 30;
};
int main()
{
 struct A sa = {0};
 scanf("%d", &sa._b);//这是错误的 
 
 //正确的⽰范 
 int b = 0;
 scanf("%d", &b);
 sa._b = b;
 return 0;
}
目录
相关文章
|
8月前
|
C语言
c语言位段知识详解
c语言位段知识详解
69 1
|
8月前
|
存储 编译器 C语言
C语言位域
C语言位域
70 0
|
存储 C语言
【C语言】位段详解
【C语言】位段详解
102 0
|
7月前
|
编译器 C语言 C++
C语言学习记录——位段(内存分配、位段的跨平台、位段的应用)
C语言学习记录——位段(内存分配、位段的跨平台、位段的应用)
64 0
|
3月前
|
C语言
那些C语言中容易忽略的小秘密
那些C语言中容易忽略的小秘密
28 0
|
8月前
|
存储 网络协议 C语言
C语言——详解位段
C语言——详解位段
69 0
C语言——详解位段
|
7月前
|
存储 编译器 C语言
C语言进阶——位段
C语言进阶——位段
47 0
|
编译器 C语言 C++
C语言之位段
C语言之位段
|
存储 C语言
C语言:指针从何而来?
指针=内存编号=地址 要理解这个点,首先需要了解一下内存空间: 内存空间为了有效管理空间,将内存划分为一份份内存单元,每份内存单元占1个字节。 每份内存单元都有一个编号,即内存编号,也叫地址。通过地址(内存编号)就可以找到某一内存空间。C语言中把地址也叫做指针,所以有:指针=内存编号=地址
75 0
|
算法 C语言 C++
【C语言技能树】位段解析与应用
在结构体中会出现内存对齐的现象,有时会浪费大量的空间,为了优化这种情况,则出现了位段。
106 0