【C语言】自定义类型:结构体深入解析(三)结构体实现位段最终篇

本文涉及的产品
云解析 DNS,旗舰版 1个月
公共DNS(含HTTPDNS解析),每月1000万次HTTP解析
全局流量管理 GTM,标准版 1个月
简介: 【C语言】自定义类型:结构体深入解析(三)结构体实现位段最终篇

🌠什么是位段?

位段是C语言中结构体的一种数据类型

位段允许在结构体中定义具有指定位数的成员,这些成员可以占用结构体变量内部的连续比特位。


位段的声明和结构是类似的,有两个不同:


1.位段的成员必须是int ,usigned int 或 signed int,在C99中位段成员的类型也可以选择其他类型。


2.位段的成员后边有一个冒号和一个数字,这个数字代表了该成员变量在结构体内占用的bit位数。它用来限定成员变量的范围和存储空间。。

话不多说,给铁铁上两者比较代码:

struct A//位段
{
    int _a : 2;
    int _b : 5;
    int _c : 10;
    int _d : 30;
};
struct B//结构体
{
  int _a ;
  int _b ;
  int _c ;
  int _d ;
};


int main()
{
  printf("位段A大小=%d\n", sizeof(struct A));
  printf("结构体B大小=%d\n", sizeof(struct B));
  return 0;
}

输出:

分析:

首先看位段Struct A有4个成员,如int _a:2这个成员中,int是类型,_a是变量名【变量名包含字母(大小写均可),数字(但不能以数字开头),下划线,如良好的变量名userName,order_calculateResult】,:2指定该位段成员占用的bit位数为2个bit,以此类推就会明白_b,_c,_d的组成情况。既然知道了他的组成,那计算他的大小吧,Struct A的大小和为47bit(2+5+10+30=47bit),然后用编译器运行大小为8(这个8意思是八个字节,也等于8*8=64个比特位)。我们通过位段的一个成员一个成员加起来是47bit,而编译器计算出的是8个字节。


阿森小问:这8个字节是内存实际占用的吗?为什么编译器不显示47个bit,而是64个bit,是不是跟结构体一样存在内存对齐呢?通过内存对齐来此应对内存的节约呢?阿森小答:没错,节省空间是没错,用的是也是同结构体一样的内存对齐的实现方式:字节对齐,不过方法不同。对于编译器来说,最小的内存单元是字节,它不会返回非整字节的bit数,因此它是按字节为单位返回,打印8个字节。位段成员总和47bit,6字节(48bit)就可以了,怎么又要8(64bit)个字节了。通过结构体(128bit)与位段(64bit)对比,我们看出他的空间节省出来了,但是他不是无限制的节省空间,虽然节省了空间,但也有浪费,阿森一会讲解怎么浪费空间的。当然对于位段是要使用在特殊场景下,如在struct B中的int _a;假设他存储134,267这么大的整数那就不适合用位段,如果要存储0,1,2,3用2bit就可以完美的存储起来了。 0可以用00,1用01,2用10,3用11表示,而用int 存储可能需要32bit,节省了很多空间!那位段怎么实现内存分配,让47(bit)变成8(64bit)字节呢?

🌉 位段的内存分配

  1. 位段的成员可以是 int, unsigned int ,signed int 或者是 char 等类型。
  2. 位段的空间上是按照需要以4个字节( int )或者1个字节( char )的⽅式来开辟的。
  3. 位段涉及很多不确定因素,位段是不跨平台的,注重可移植的程序应该避免使⽤位段。

用代码理解:

struct A
{
    int _a : 2;
    int _b : 5;
    int _c : 10;
    int _d : 30;
};

阿森把宝图解分析:

首先_a的类型是int ,申请了4个字节,开辟32bit空间,_a需要2bit,到底是从右边开始使用,还是从左边使用这两个空间开始的,这个是不确定的,标准C语言并没有给规定,这取决于编译器,注:这不是大小端问题。假设它从右向左,分配2个空间给_a(绿色),然后再继续分配5个空间给_b(黄色),接着_c(蓝色)说我需要10bit,最后还剩下 15bit,接下来_d说我需要30个bit,15个bit不够,内存说:那就再给你开辟一个整形32个bit吧!然后他就存储完剩下的15bit,再存储新开辟的32bit里分配15bit继续存储,这是一种方式!当然也有第二种可能:剩下的我浪费掉,我不用,反正不够,那我在新开辟的空间里一些性存储完30个bit,这是不是一种方式。对于这个剩下的15个bit会不会使用,C语言有没有给规定,这也取决于编译器,VS是一种实现,gcc是一种实现,这就说明了位段有很多不确定因素,位段是不跨平台的,位段是如何开辟空间的,是严格依赖编译器的!注重可以植平台应该避免使用位段,如果要使用,应该明白其开辟空间原理,避免造成不必要的麻烦!

🌉VS怎么开辟位段空间呢?

上代码来一起实战理解:

struct S
{
    char a : 3;
    char b : 4;
    char c : 5;
    char d : 4;
};

int main()
{
    struct S s = { 0 };
    s.a = 10;
    s.b = 8;
    s.c = 3;
    s.d = 4;
    printf("%d\n", sizeof(s));
    return 0;
}

代码运行:

阿森双手把宝图奉上:

图解分析:

首先一上来给s的成员都初始化为0,也就是每个bit都初始化为0,s里的每个成员类型都是char,为了更好的理解他开辟的空间是什么样的?我们先开辟一个字节(8bit(两个黑色箭头处在同一字节处)),开辟好了,a占3个bit,是从2个黑色箭头往左使用,还是从开头往右使用的呢?剩余的空间不够了,是浪费,还是不浪费呢?这样子吧!我们先假设一种方案来:1. 从右向左使用,2.如果剩余的空间不够就直接使用下一个空间,浪费掉。


开始–>:先看两个箭头指向一个字节处,a是10,用二进制位表示01010(注:在x86环境下,整数10二进制表示方式为0000 1010,这里为了方便看,简写5为就能理解了),a要3bit,并没有把a全部存进去,从a取低位开始010,接着箭头移动三格,然后b要4bit,取1100,放进去,此时8bit只剩下1bit,根据我们定下的规则,如果剩余的空间不够,就浪费,使用下一个。好!接下来再开辟一个字节(8bit),黑色箭头指向下一个字节最右边,c你要5个bit,好!一下子满足你,此时发现8bit只剩下3bit了又不够,好!编译器说:再给你在内存空间里弄一个字节(8bit)吧,d要4bit,最后用了4bit,都存完了,总共3个字节。你可能说:有没有巧合呢?不充分吧!那阿森和你一起就调试起来看看内存和监视吧:


注意:在内存窗口我们看到是16进制存储方式,先把我们成员存储进去的bit进行16进制转换,再看内存。

拓展:2进制转16进制方式:

16进制的数字每⼀位是0~9, a ~f 的,0 ~9,a ~ f的数字,各⾃写成2进制,最多有4个2进制位就⾜够了,

如:2进制的01101011,换成16进制:0x6b,16进制表⽰的时候前⾯加0x

因此,我们把每个字节(8bit)划分2段4bit,然后再加上0x就可以;

第一个字节是前4位0110–>2^0+ 2^1+ 2^1+ 2^0=6,后4bit为0010–> 2^0+ 2^0 +2^1 + 2^0=2,剩下的都是同样方法,00000011表示0x03,00000100表示0x04,接下来看内存调试:

看出内存显示的确是62 03 04,一模一样。说明我们刚刚的方案是正确,符合VS的存储方式的:在一个字节内部存储数据从右向左使用,如果剩余的空间不够,就浪费。

代码输出:

分析结果:

这里可以看出开辟了3个字节,就可以把我们想存储的数据就存好了,如果没有位段的使用,用结构体要开辟4个char类型,多出来一个字节,相对来说节省了空间。


当你读到这里,你已经明白了VS对位段的开辟是怎么样操作的,此时让我们给自己鼓个掌,送给自己,继续加油!

阿森和你再理清这3个字节是不是一次性开辟的存储数据,还是创建完一个字节存储数据,再创建一个字节再存储数据的。

用图更容易理解:

s是编译器一次性开辟好的,然后再存储数据,文章中为了更好的理解他的流程,所以用了一个字节开辟一个字节开辟的存储的数据!

内存调试也可以方便观察:按F10调试内存来看看,给内存输入&s,当调试s的成员进行初始化为0时,内存显示3个字节变红了,都为0,后面cc代表着还未被初始化,为随机值(经典烫烫烫),可以看出在给一个成员s开辟内存空间时,编译器是一下子分配好的,不是开辟一个字节空间就存储数据,内存调试图在下↓

🌉位段的跨平台问题

  1. int 位段被当成有符号数还是⽆符号数是不确定的。
  2. 位段中最⼤位的数⽬不能确定。(16位机器最⼤16,32位机器最⼤32,写成27,在16位机器会出问题。
  3. 位段中的成员在内存中从左向右分配,还是从右向左分配标准尚未定义。
  4. 当⼀个结构包含两个位段,第⼆个位段成员⽐较⼤,⽆法容纳于第⼀个位段剩余的位时,是舍弃

剩余的位还是利⽤,这是不确定的。

总结:

跟结构相⽐,位段可以达到同样的效果,并且可以很好的节省空间,但是有跨平台的问题存在。

🌠 位段的应⽤

下图是⽹络协议中,IP数据报的格式,我们可以看到其中很多的属性只需要⼏个bit位就能描述,这⾥使⽤位段,能够实现想要的效果,也节省了空间,这样⽹络传输的数据报⼤⼩也会较⼩⼀些,对⽹络的畅通是有帮助的。


IP数据报(IP Datagram)是IP(Internet Protocol)网络层协议传输的数据单元。


网络协议中ip数据报的格式:

IP数据报报头中的许多字段,其值的范围很小,只需要使用少量比特位就可以表示,这就适合使用位段表示。


比如说4位版本号版本号是不是给4bit就可以了?首部长度给4bit,服务类型给8bit,总长度给16bit,包括这个地方的标志位给上3bit就可以了,那像这种是不是实现这位段的形式更好一些?

什么叫ip数据报?简单地说一下,假设呢,你要聊天,说a要发一个信息给b。

假设我们的使用微信,你在微信上发了一个元旦快来啦,之后,你就一下子就发到b手机上去了吗,你只要把它扔到网络上,就发到b的手机去了,不是的。

首先发送数据时,不仅仅发送原始数据,还需要封装额外的控制信息,如版本号、长度、源地址、目的地址等,组成完整的IP数据报,这些控制字段使用位段表示,精确占用需要的比特位数,可以最大限度节省空间。源地址和目的地址决定数据报发往哪里,避免误发。


数据报大小合理,就像网络上车流量合理,可以提高传输效率(如果封装的13个数据都是int好比许多大车,传输效率慢,合理位段像不同的小车高效运行传输)

小尺寸的IP数据报更利于网络传输。因为网络传输的开销很大程度上取决于数据包的大小。

网络协议定义了数据报的格式,保证发送和接收双方都能正确理解数据内容。使用位段表示IP报头字段,可以有效减小IP数据报的大小,这对网络传输性能和通信效率都很有利。所以,位段就起到了一个很好的编解码方法,它可以帮助IP数据报更高效地使用报头空间,实现报头字段的最优编码。


这也是IP报头设计中广泛使用位段的重要原因。它可以很好地将IP数据报大小控制在一个合理范围内。

🌠位段使⽤的注意事项

位段的⼏个成员共有同⼀个字节,这样有些成员的起始位置并不是某个字节的起始位置,那么这些位置处是没有地址的。


内存中每个字节分配⼀个地址,⼀个字节内部的bit位是没有地址的。所以不能对位段的成员使⽤&操作符,这样就不能使⽤scanf直接给位段的成员输⼊值,只能是先输⼊放在⼀个变量中,然后赋值给位段的成员。

代码:

struct A
{
  int _a : 2;
  int _b : 5;
  int _c : 10;
  int _d : 30;
};

int main()
{
  struct A sa = { 0 };
  scanf("%d", &sa._b);//这是错误的
  return 0;
}

错误显示图:

正确方法:必须先将输入值存入有地址的普通变量中,然后赋值给位段成员。

例如先scanf输入一个整数到变量b,然后b的某几位赋值给位段成员。

正确代码:

struct A
{
  int _a : 2;
  int _b : 5;
  int _c : 10;
  int _d : 30;
};

int main()
{
  struct A sa = { 0 };
  //正确的⽰范
  int b = 0;
  scanf("%d", &b);
  sa._b = b;
  return 0;
}

代码运行显示可运行输入图:


🚩总结

这次阿森和你一起学习什么是位段? 位段的内存分配,VS怎么开辟位段空间呢?位段的跨平台问题,位段的应⽤,位段使⽤的注意事项,阿森将下一节和你一起学习联合体和枚举💗。


感谢你的收看,如果文章有错误,可以指出,我不胜感激,让我们一起学习交流,如果文章可以给你一个小小帮助,可以给博主点一个小小的赞😘,也可以点个小小的关注哦💘

相关文章
|
16天前
|
存储 C语言
如何在 C 语言中实现结构体的深拷贝
在C语言中实现结构体的深拷贝,需要手动分配内存并逐个复制成员变量,确保新结构体与原结构体完全独立,避免浅拷贝导致的数据共享问题。具体方法包括使用 `malloc` 分配内存和 `memcpy` 或手动赋值。
26 10
|
16天前
|
安全 编译器 Linux
【c语言】轻松拿捏自定义类型
本文介绍了C语言中的三种自定义类型:结构体、联合体和枚举类型。结构体可以包含多个不同类型的成员,支持自引用和内存对齐。联合体的所有成员共享同一块内存,适用于判断机器的大小端。枚举类型用于列举固定值,增加代码的可读性和安全性。文中详细讲解了每种类型的声明、特点和使用方法,并提供了示例代码。
16 3
|
16天前
|
存储 大数据 编译器
C语言:结构体对齐规则
C语言中,结构体对齐规则是指编译器为了提高数据访问效率,会根据成员变量的类型对结构体中的成员进行内存对齐。通常遵循编译器默认的对齐方式或使用特定的对齐指令来优化结构体布局,以减少内存浪费并提升性能。
|
20天前
|
编译器 C语言
共用体和结构体在 C 语言中的优先级是怎样的
在C语言中,共用体(union)和结构体(struct)的优先级相同,它们都是用户自定义的数据类型,用于组合不同类型的数据。但是,共用体中的所有成员共享同一段内存,而结构体中的成员各自占用独立的内存空间。
|
20天前
|
存储 C语言
C语言:结构体与共用体的区别
C语言中,结构体(struct)和共用体(union)都用于组合不同类型的数据,但使用方式不同。结构体为每个成员分配独立的内存空间,而共用体的所有成员共享同一段内存,节省空间但需谨慎使用。
|
25天前
|
编译器 C语言 C++
C语言结构体
C语言结构体
22 5
|
26天前
|
编译器 Linux C语言
C语言 之 结构体超详细总结
C语言 之 结构体超详细总结
14 0
|
30天前
|
存储 编译器 Linux
深入C语言:探索结构体的奥秘
深入C语言:探索结构体的奥秘
|
30天前
|
存储 编译器 C语言
c语言回顾-结构体(2)(下)
c语言回顾-结构体(2)(下)
28 0
|
30天前
|
存储 编译器 程序员
c语言回顾-结构体(2)(上)
c语言回顾-结构体(2)(上)
27 0

推荐镜像

更多
下一篇
无影云桌面