C++STL-string类的使用
一.STL简介
网上有句话说:“不懂STL,不要说你会C++”,可见STL对C++的重要性。STL(standard template libaray-标准模板库):是 C++标准库的重要组成部分 ,不仅是一个可复用的组件库,而且是一个包罗数据结构与算法的软件框架。
1.STL框架
2.STL版本
原始版本
Alexander Stepanov、Meng Lee 在惠普实验室完成的原始版本,本着开源精神,他们声明允许任何人任意运用、拷贝、修改、
传播、商业使用这些代码,无需付费。唯一的条件就是也需要向原始版本一样做开源使用。 HP 版本–所有STL实现版本的始祖。
P. J. 版本
由P. J. Plauger开发,继承自HP版本,被Windows Visual C++采用,不能公开或修改,缺陷:可读性比较低,符号命名比较怪异。
RW版本
由Rouge Wage公司开发,继承自HP版本,被C+ + Builder 采用,不能公开或修改,可读性一般。
SGI版本
由Silicon Graphics Computer Systems,Inc公司开发,继承自HP版 本。被GCC(Linux)采用,可移植性好,可公开、修改甚至贩卖,从命名风格和编程风格上看,阅读性非常高。我们后面学习STL要阅读部分源代码,主要参考的就是这个版本。
二.编码铺垫
string的出现其实在STL之前,从发展历史来看,string其实不算STL的内容。但是从功能上来看string又应该划入STL的内容。
可以看到库中的string是一个模板,为什么要将string写成模板?
在我们的印象中认为字符串类型都是单字节的,但为了表示汉字或者其他复杂的字符,还有双字节的char(u16string)甚至四字节的char(u32string)。将string写成模板主要是方便使用这两种字符类型。
ASCII码
美国标准信息交换码
只有256个字符
万国码(Unicode)
因为ASCII码的字符太少无法表示汉字这样的复杂字符,为了解决传统的字符编码方案的局限Unicode就产生了,它为每种语言中的每个字符设定了统一并且唯一的二进制编码
包括了utf-8,utf-16,utf-32
因为utf-8兼容了ASCII,也比较节省空间,所以untf-8的使用是最广泛的。(我们使用的也就是utf-8)
GBK
中华文化博大精深,源远流长。国外很难清楚的理解各个汉字之间的表达,所以我国的专业人士就设计了GBK这款编码,使用的是双字节编码。
三.string类
上述的资料查询都是出自:Reference - C++ Reference (cplusplus.com),这个网站在我们学习STL时要经常使用。
根据编码使用的不同,这里提供了四种string(它们的接口差不多),但是我们只要学习第一个string即可(utf-8编码,单字节)。
string类模板的基本架构:
template<class T> class basic_string { private: T*str; size_t size; size_t capacity; }
在使用string时要包含头文件#include<string>
string提供了一百多个接口函数,下面只讲解一些使用频率相对较高的函数。
1.常用的构造函数
(constructor)函数名称 | 功能说明 |
string() (重点) | 构造空的string类对象,即空字符串 |
string(const char* s) (重点) | 用C-string来构造string类对象 |
string(size_t n, char c) | string类对象中包含n个字符c |
string(const string&s) (重点) | 拷贝构造函数 |
void test_string1() { string s1;//无参构造 string s2("Hello STL");//使用字符串构造 string s3(s2);//拷贝构造 string s4(4, 'w');//使用4个w字符构造 string s5(s2.begin(), s2.begin() + 3);//使用迭代器构造 string s6(s2,2,6);//用s2的第二个位置开始往后的六个字符构造 }
对于s6如果要求初始化长度超出了s2的长度,会发生什么?
对于不确定的要优先考虑查文档
补充
对于string可以直接使用cout和cin,因为库中对流插入和流提取重载过。
2.元素访问
函数名称 | 功能说明 |
operator[] (重 点) | 返回pos位置的字符,const string类对象调用 |
begin+ end | begin获取一个字符的迭代器 + end获取最后一个字符下一个位置的迭 代器 |
rbegin + rend | begin获取一个字符的迭代器 + end获取最后一个字符下一个位置的迭 代器 |
范围for | C++11支持更简洁的范围for的新遍历方式 |
1.operator[]
重载了[]使得string类可以像字符数组一样读写
void test_string2() { string s1("123456"); for (int i = 0; i < s1.size(); i++) { cout << s1[i]; } cout << endl; for (int j = 0; j < s1.size(); j++) { s1[j]+=1; } cout << s1 << endl; }
除了重载[]以外,库中还给了一个at函数用来访问string
operator[]与at的不同之处在于,operator[]使用断言,而at则是抛异常。这是因为在release下assert失效
2.范围for
void test_string2() { string s("1234"); //范围for的遍历访问 for (auto ch : s) { cout << ch; } cout << endl; //范围for的修改 for (auto& hh : s) { hh++; } cout << s << endl; }
3.iterator迭代器
迭代器的行为像指针,但不一定是指针。
对于string类来说底层是一个顺序表,使用[]就可以访问,但对于其他的STL来说却不能使用[]。
迭代器的意义在于通用,所有容器都可以使用迭代器这种方式去进行遍历和修改。而对于string类,[]足矣。
a.正向迭代器
void test_string2() { string s("23456"); string::iterator it = s.begin();//迭代器的使用要表明类域 //迭代器的读 while (it != s.end()) { cout << *it; it++; } cout << endl; //迭代器修改 it = s.begin();//将迭代器的位置重置到串首 while (it != s.end()) { *it += 1; cout << *it; it++; } }
b.反向迭代器
void test_string2() { string s("4567"); string::reverse_iterator it = s.rbegin(); //反向迭代器的读 while (it != s.rend()) { cout << *it; it++; } cout << endl; //反向迭代器的写 it = s.rbegin(); while (it != s.rend()) { *it += 1; cout << *it; it++; } }
c.const正向迭代器(不可修改*it)
void test_string2() { string s("2345"); string::const_iterator it = s.cbegin(); while (it != s.cend()) { cout << *it; it++; } }
d.const反向迭代器
void test_String2() { string s("2345"); string::const_reverse_iterator it = s.crbegin(); while (it!=s.crend()) { cout << *it; it++; } }
Capacity容量操作
函数名称 | 功能说明 |
size(重点) | 返回字符串有效字符长度 |
length | 返回字符串有效字符长度 |
capacity | 返回空间总大小 |
empty (重点) | 检测字符串释放为空串,是返回true,否则返回false |
clear (重点) | 清空有效字符 |
reserve (重点) | 为字符串预留空间 |
resize (重点) | 将有效字符的个数该成n个,多出的空间用字符c填充 |
因为知道是字符串所以清楚的知道有效大小是length,但对于其他STL成员来说,size的可读性会更高
a.reserve(调整容量)
这里我调整s1的大小为100,但是vs2022底层考虑了对齐等因素给的比100还要大一些
下面我们在g++下看一下结果:
在Linux下,对于无参构造开辟的string的容量是0,而我reserve多少就是多少不会多给。
b.resize(调整size)
size变了capacity也变了,因为size超过原本的capacity之后还要继续插入元素就要扩容。(size是string有效字符的长度,扩大size会往后面补’\0’)
Modify修改操作
函数名称 | 功能说明 |
push_back | 在字符串后尾插字符c |
append | 在字符串后追加一个字符串 |
operator+= (重点) | 在字符串后追加字符串str |
c_str(重点) | 返回C格式字符串 |
find + npos(重点) | 从字符串pos位置开始往后找字符c,返回该字符在字符串中的位置 |
rfind | 从字符串pos位置开始往前找字符c,返回该字符在字符串中的位置 |
substr | 在str中从pos位置开始,截取n个字符,然后将其返回 |
void test_string3() { //find+replace可以替换空格 string s("Hello STL"); size_t pos = s.find(' '); while (pos != string::npos) { s.replace(pos, 1, "%20d"); pos = s.find(' ', pos + 3); } cout << s << endl; }
void test_string4() { string s("hello world"); //虽然打印结果一样,但c_str()返回const char*,可以用于返回值有要求的地方 cout << s << endl; cout << s.c_str() << endl; string file("test.txt"); FILE* fout = fopen(file.c_str(), "w"); }
void test_string() { string s("Hello STL"); size_t pos=s.find(' '); string s2=s.substr(pos+1); cout<<s2<<endl; }
rfind就是从最后一个位置开始查找
非成员函数重载
流插入和流提取都是以空格,换行为结束标志的(scanf也是这样)。
但是这种方式有些情况就会很尴尬,比如这个题:字符串最后一个单词的长度_牛客题霸_牛客网 (nowcoder.com)
string为了解决这个问题,提供了getline
getline要遇到’\n’才会结束
可以使用getline解决有空格的字符问题