C++标准库 bitset

简介:

有些程序要处理二进制位的有序集,每个位可能包含 0(关)1(开)值。位是用来保存一组项或条件 的 yes/no 信息(有时也称标志)的简洁方法。标准库提供的 bitset 类简化了位集的处理。要使用 bitset 类就必须包含相关的头文件。在本书提供的例子中,假设都使用 std::bitset 的using声明:

#include <bitset>
using std::bitset;

bitset 对象的定义和初始化

下表列出了 bitset 的构造函数。类似于 vector,bitset 类是一种类模板;而与 vector 不一样的 是 bitset 类型对象的区别仅在其长度而不在其类型。在定义 bitset 时,要明确 bitset 含有多少位,须在尖括号内给出它的长度值:

bitset<n> b; b 有 n 位,每位都 0
bitset<n> b(u); b 是 unsigned long 型 u 的一个副本
bitset<n> b(s); b 是 string 对象 s 中含有的位串的副本
bitset<n> b(s, pos, n); b 是 s 中从位置 pos 开始的; n 个位的副本。
bitset<32> bitvec; // 32 bits, all zero

给出的长度值必须是常量表达式。正如这里给出的,长度值值必须定义为整型字面值常量或是已 用常量值初始化的整型的 const 对象。这条语句把 bitvec 定义为含有 32 个位的 bitset 对象。和 vector 的元素一样,bitset 中的位是没有命名的,程序员只能按位置来访问。位集合的位置编号从 0 开始,因此,bitvec 的位序是从 0 到 31。 以 0 位开始的位串是低阶位(low-order),以 31 位结束的位串是高阶位( high-order)。

用 unsigned 值初始化 bitset 对象

当用 unsigned long 值作为 bitset 对象的初始值时,该值将转化为二进制的位模式。而 bitset 对象中 的位集作为这种位模式的副本。如果 bitset 类型长度大于 unsigned long 值的二进制位数,则其余的高 阶位将置为 0;如果 bitset 类型长度小于 unsigned long 值的二进制位数,则只使用 unsigned 值中的 低阶位,超过 bistset 类型长度的高阶位将被丢弃。

在 32 位 unsigned long 的机器上,十六进制值 0xffff 表示为二进制位就是十六个 1 和十六个 0(每 个 0xf 可表示为 1111)。可以用 0xffff 初始化 bitset 对象:

// bitvec1 is smaller than the initializer
 bitset<16> bitvec1(0xffff); // bits 0 ... 15 are set to 1
 // bitvec2 same size as initializer
 bitset<32> bitvec2(0xffff); // bits 0 ... 15 are set to 1; 16 ... 31 are 0
 // on a 32-bit machine, bits 0 to 31 initialized from 0xffff
 bitset<128> bitvec3(0xffff); // bits 32 through 127 initialized to zero

上面的三个例子中,0 到 15 位都置为 1。由于 bitvec1 位数少于 unsigned long 的位数,因 此 bitvec1 的初始值的高阶被丢弃。bitvec2 和 unsigned long 长度相同,因此所有位正好放置了初始值。bitvec3 长度大于 32,31 位以上的高阶位就被置为 0。

用 string 对象初始化 bitset 对象
当用 string 对象初始化 bitset 对象时,string 对象直接表示为位模式。从 string 对象读入位集的顺 序是从右向左(from right to left):

string strval("1100");
bitset<32> bitvec4(strval);

bitvec4 的位模式中第 2 和 3 的位置为 1,其余位置都为 0。如果 string 对象的字符个数小 于 bitset 类型的长度,则高阶位置为 0。

string 对象和 bitsets 对象之间是反向转化的:string 对象的最右边字符(即下标最大的那个字符)用来初始化 bitset 对象的低阶位(即下标为 0 的位)。当用string对象初始化 bitset 对象时,记住这一差别很重要。

不一定要把整个 string 对象都作为 bitset 对象的初始值。相反,可以只用某个子串作为初始值:

string str("1111111000000011001101");
bitset<32> bitvec5(str, 5, 4); // 4 bits starting at str[5], 1100
bitset<32> bitvec6(str, str.size() - 4); // use last 4 characters

这里用 str 从 str[5] 开始包含四个字符的子串来初始化 bitvec5。照常,初始化 bitset 对象时总是从子串最右边结尾字符开始的,bitvec5 的从 3 到 0 的二进制位置为 1100 ,其他二进制位都置为 0。如果 省略第三个参数则意味着取从开始位置一直到 string 末尾的所有字符。本例中,取出 str 末尾的四位来 对 bitvec6 的低四位进行初始化。bitvec6 其余的位初始化为 0。这些初始化过程的图示如下:

bitset 对象上的操作

多种 bitset 操作( 表 3.7)用来测试或设置 bitset 对象中的单个或多个二进制位。

测试整个 bitset 对象
如果 bitset 对象中有一个或几个二进制位置为 1,则 any 操作返回 true,也就是说,其返回值等于 1; 相反,如果 bitset 对象中二进制位全为 0,则 none 操作返回 true。

bitset<32> bitvec; // 32 bits, all zero
bool is_set = bitvec.any(); // false, all bits are zero
bool is_not_set = bitvec.none(); // true, all bits are zero

如果需要知道置为 1 的二进制位的个数,可以使用 count 操作,该操作返回置为 1 的二进制位的个数:

size_t bits_set = bitvec.count(); // returns number of bits that are on

count 操作的返回类型是标准库中命名为 size_t 类型。size_t 类型定义在 cstddef 头文件中,该文件 是 C 标准库的头文件 stddef.h 的 C++ 版本。它是一个与机器相关的 unsigned 类型,其大小足以保证存 储内在中对象的大小。
与 vector 和 string 中的 size 操作一样,bitset 的 size 操作返回 bitset 对象中二进制位的个数, 返回值的类型是 size_t:: 

size_t sz = bitvec.size(); // returns 32

访问 bitset 对象中的位
可以用下标操作符来读或写某个索引位置的二进制位,同样地,也可以用下标操作符测试给定二进制位的值 或设置某个二进制们的值:

// assign 1 to even numbered bits
 for (int index = 0; index != 32; index += 2)
 bitvec[index] = 1;

上面的循环把 bitvec 中的偶数下标的位都置为 1。
除了用下标操作符,还可以用 set;、test 和 reset 操作来测试或设置给定二进制位的值:

// equivalent loop using set operation
 for (int index = 0; index != 32; index += 2)
 bitvec.set(index);

为了测试某个二进制位是否为 1,可以用 test 操作或者测试下标操作符的返回值:

if (bitvec.test(i))
 // bitvec[i] is on
 // equivalent test using subscript
 if (bitvec[i])
 // bitvec[i] is on

如果下标操作符测试的二进制位为 1,则返回的测试值的结果为 true,否则返回 false。
对整个 bitset 对象进行设置
set 和 reset 操作分别用来对整个 bitset 对象的所有二进制位全置 1 和全置 0:

bitvec.reset(); // set all the bits to 0.
bitvec.set(); // set all the bits to 1

flip 操作可以对 bitset 对象的所有位或个别位取反

bitvec.flip(0); // reverses value of first bit
bitvec[0].flip(); // also reverses the first bit
bitvec.flip(); // reverses value of all bits

获取 bitset 对象的值
to_ulong 操作返回一个 unsigned long 值,该值与 bitset 对象的位模式存储值相同。仅当 bitset 类型 的长度小于或等于 unsigned long 的长度时,才可以使用 to_ulong 操作:

unsigned long ulong = bitvec3.to_ulong();
cout << "ulong = " << ulong << endl;

to_ulong 操作主要用于把 bitset 对象转到 C 风格或标准 C++ 之前风格的程序上。如果 bitset 对象包 含的二进制位数超过 unsigned long 长度, 将会产生运行时异常。

输出二进制位
可以用输出操作符输出 bitset 对象中的位模式:

bitset<32> bitvec2(0xffff); // bits 0 ... 15 are set to 1;  16 ... 31 are 0
cout << "bitvec2: " << bitvec2 << endl;
目录
相关文章
|
3月前
|
算法 C++ 容器
C++标准库(速查)总结
C++标准库(速查)总结
86 6
|
3月前
|
存储 算法 C++
C++ STL 初探:打开标准模板库的大门
C++ STL 初探:打开标准模板库的大门
126 10
|
1天前
|
XML 网络协议 API
超级好用的C++实用库之服务包装类
通过本文对Boost.Asio、gRPC和Poco三个超级好用的C++服务包装类库的详细介绍,开发者可以根据自己的需求选择合适的库来简化开发工作,提高代码的效率和可维护性。每个库都有其独特的优势和适用场景,合理使用这些库可以极大地提升C++开发的生产力。
24 11
|
2月前
|
存储 缓存 算法
【C++】BitSet和Bloom_Filter
位图(Bitmap)和布隆过滤器(Bloom Filter)是两种高效的数据结构。位图使用每一位二进制数表示数据项的存在状态,适用于精确判断元素存在性,广泛应用于图形图像处理、数据压缩、数据库索引等领域。布隆过滤器通过多个哈希函数将元素映射到位数组,用于快速判断元素是否可能属于集合,特别适合处理大规模数据,尽管存在误判率,但在网页缓存、网络数据包过滤等场景中表现出色。两者在空间效率、查询速度及误判率方面各有优势,适用于不同的应用场景。
50 4
|
3月前
|
存储 程序员 C++
C++常用基础知识—STL库(2)
C++常用基础知识—STL库(2)
89 5
|
3月前
|
存储 自然语言处理 程序员
C++常用基础知识—STL库(1)
C++常用基础知识—STL库(1)
82 1
|
4月前
|
编译器 API C语言
超级好用的C++实用库之跨平台实用方法
超级好用的C++实用库之跨平台实用方法
47 6
|
4月前
|
安全 C++
超级好用的C++实用库之环形内存池
超级好用的C++实用库之环形内存池
77 5
|
4月前
|
缓存 网络协议 Linux
超级好用的C++实用库之套接字
超级好用的C++实用库之套接字
40 1
|
4月前
|
存储 算法 安全
超级好用的C++实用库之sha256算法
超级好用的C++实用库之sha256算法
166 1