【C++ STL】string基础知识-阿里云开发者社区

【C++ STL】string基础知识

2023-05-23 155

版权

本文内容由阿里云实名注册用户自发贡献，版权归原作者所有，阿里云开发者社区不拥有其著作权，亦不承担相应法律责任。具体规则请查看《阿里云开发者社区用户服务协议》和《阿里云开发者社区知识产权保护指引》。如果您发现本社区中有涉嫌抄袭的内容，填写侵权投诉表单进行举报，一经查实，本社区将立刻删除涉嫌侵权内容。

简介： 本篇将学习string类的基础知识

前言

本篇将学习string类的基础知识

🕺作者：迷茫的启明星

专栏：《C++初阶》

1. 为什么要学习string类

1.1 C语言中的字符串不够好用

C语言中，字符串是以’\0’结尾的一些字符的集合，为了操作方便，C标准库中提供了一些str系列的库函数，但是这些库函数与字符串是分离开的，不太符合OOP的思想，而且底层空间需要用户自己管理，稍不留神可能还会越界访问。

2. 标准库中的string类

2.1 string类(了解)

string类的文档介绍

字符串是表示字符序列的类

标准的字符串类提供了对此类对象的支持，其接口类似于标准字符容器的接口，但添加了专门用于操作单字节字符字符串的设计特性。

string类是使用char(即作为它的字符类型，使用它的默认char_traits和分配器类型(关于模板的更多信息，请参阅basic_string)。

string类是basic_string模板类的一个实例，它使用char来实例化basic_string模板类，并用char_traits和allocator作为basic_string的默认参数(根于更多的模板信息请参考basic_string)。

注意，这个类独立于所使用的编码来处理字节:如果用来处理多字节或变长字符(如UTF-8)的序列，这个类的所有成员(如长度或大小)以及它的迭代器，将仍然按照字节(而不是实际编码的字符)来操作。

总结：

string是表示字符串的字符串类

该类的接口与常规容器的接口基本相同，再添加了一些专门用来操作string的常规操作。

string在底层实际是：basic_string模板类的别名，typedef basic_string<char, char_traits, allocator>string;

不能操作多字节或者变长字符的序列。

在使用string类时，必须包含#include头文件以及using namespace std;

2.2 string类的常用接口说明

想更多了解的可以看这里：http://www.cplusplus.com

相关比较常用的实现我都在这篇博客中实现过了（☞《从零开始实现 std::string：让你更深入地了解字符串的本质》）

string类对象的常见构造
(constructor)函数名称 功能说明
string() （重点） 构造空的string类对象，即空字符串
string(const char* s) （重点）  用C-string来构造string类对象
string(size_t n, char c)  string类对象中包含n个字符c
string(const string&s) （重点） 拷贝构造函数
string (const string& str, size_t pos, size_t len = npos);  取前一个字符串的一段
string (const char* s, size_t n); 取前面一个字符串的前n个字符
void Teststring1()
{
    string s1; 
    // 构造空的string类对象s1
    string s2("hello world!!!"); 
    // 用C格式字符串构造string类对象s2
    string s3(s2); 
    // 拷贝构造s3
    string s4(s2, 6, 5);
    //从坐标6开始，取长度为5的一段字符,如果第三个参数len大于后面字符长度，有多少拷贝多少拷贝到结尾
    string s5("hello world", 5);
    //取前面字符串的前5个字符“hello”
    string s6(100, 'x');
    //构成一个含100个x字符的字符串
}

2.3 string类对象的容量操作

函数名称功能

size 返回字符串有效字符长度

length 返回字符串有效字符长度

capacity 返回空间总大小

empty 检测字符串释放为空串，是返回true，否则返回false

clear 清空有效字符

reserve 为字符串预留空间

resize 将有效字符的个数该成n个，多出的空间用字符c填充

注意：

size()与length()方法底层实现原理完全相同，引入size()的原因是为了与其他容器的接口保持一致，一般情况下基本都是用size()。

clear()只是将string中有效字符清空，不改变底层空间大小。

resize(size_t n) 与 resize(size_t n, char c)都是将字符串中有效字符个数改变到n个，

不同的是当字符个数增多时：resize(n)用0来填充多出的元素空间，

resize(size_t n, char c)用字符c来填充多出的元素空间。

注意：resize在改变元素个数时，如果是将元素个数增多，可能会改变底层容量的大小，

如果是将元素个数减少，底层空间总大小不变。

reserve(size_t res_arg=0)：为string预留空间，不改变有效元素个数，当reserve的参数小于string的底层空间总大小时，reserver不会改变容量大小。

示例：

#include<iostream>
using namespace std;
int main()
{
  string s("1314520");
  cout << "s的长度："<<s.size() << endl;
  cout << "s的长度：" << s.length() << endl;
  cout << "s的容量：" << s.capacity() << endl;
  cout << "s是否为空：" << s.empty() << endl;
  s.clear();//清除字符
  cout << s << endl;
  s="1314520";//重新设置字符串
  s.reserve(520);//设置空间
  cout << "重新设置后s的容量："<<s.capacity() << endl;
  s.resize(13);//设置有效字符串的长度，多余的用第二个参数填补，默认为""
  cout << "重新设置后s的长度：" << s.size() << endl;
  s.resize(19,'s');//设置填充值为's'
  cout << "重新设置后s的长度：" << s.size() <<" ""重新设置后的s："<<s << endl;
  return 0;
}

输出：

2.4string类对象的访问及遍历操作

函数名称功能说明

operator[] 返回pos位置的字符，const string类对象调用

begin / end begin获取一个字符的迭代器 + end获取最后一个字符下一个位置的迭代器

rbegin / rend begin获取一个字符的迭代器 + end获取最后一个字符下一个位置的迭代器

范围for C++11支持更简洁的范围for的新遍历方式

示例：

#include<iostream>
using namespace std;
int main()
{
  string s("1314520");
  cout << s[2] << endl;
  reverse(s.begin(), s.end());//翻转字符串
  cout <<s<<endl;
  reverse(s.rbegin(), s.rend());//再次翻转
  cout << s << endl;
  for (auto ch : s)
  {
  cout << ch;
  }
  return 0;
}

输出：

2.5 string类对象的修改操作

函数名称功能

push_back 在字符串后尾插字符c

append 在字符串后追加一个字符串

operator+= 在字符串后追加字符串str

c_str 返回C格式字符串

find / npos 从字符串pos位置开始往后找字符c，返回该字符在字符串中的位置

rfind 从字符串pos位置开始往前找字符c，返回该字符在字符串中的位置

substr 在str中从pos位置开始，截取n个字符，然后将其返回

insert 在str中从pos位置开始,插入字符或字符串（常用）

注意：

在string尾部追加字符时，s.push_back© / s.append(1, c) / s += 'c’三种的实现方式差不多，一般情况下string类的+=操作用的比较多，+=操作不仅可以连接单个字符，还可以连接字符串。

对string操作时，如果能够大概预估到放多少字符，可以先通过reserve把空间预留好。

示例：

#include<iostream>
using namespace std;
int main()
{
  string s("1314520");
  cout << "原来的s：" << s << endl;
  s.push_back('a');
  cout << "尾插后的s：" << s<<endl;
  s += " 3.141559";
  cout << "追加字符串后的s:" << s << endl;
  cout << "输出C格式字符串:"<<s.c_str() << endl;//输出C格式字符串
  cout << s.find('5') << endl;//从左开始往后找字符c，返回该字符在字符串中的位置
  cout<< s.rfind('5') << endl;//从右开始往后找字符c，返回该字符在字符串中的位置
  cout << s.substr(4,3) << endl;//从坐标4往后截取3个字符
  cout << s.insert(0, "天青色等烟雨");//插入字符串
  return 0;
}

输出：

2.6 string类非成员函数

函数功能

operator+ 尽量少用，因为传值返回，导致深拷贝效率低

operator>> 输入运算符重载

operator<< 输出运算符重载

getline 获取一行字符串

relational oprators 大小比较

2.7 vs和g++下string结构的说明

注意：下述结构是在32位平台下进行验证，32位平台下指针占4个字节。

vs下string的结构

string总共占28个字节，内部结构稍微复杂一点，先是有一个联合体，联合体用来定义string中字符串的存储空间：

当字符串长度小于16时，使用内部固定的字符数组来存放

当字符串长度大于等于16时，从堆上开辟空间

union _Bxty
{ // storage for small buffer or pointer to larger one
    value_type _Buf[_BUF_SIZE];
    pointer _Ptr;
    char _Alias[_BUF_SIZE]; // to permit aliasing
} _Bx;

这种设计其实挺符合人性的，大多数情况下字符串的长度都小于16，那么当string对象创建好以后，内部已经有了16个字符数组得到固定空间，不需要再通过堆创建，效率就比较高了

组成：

一个size_t字段保存字符串长度

一个size_t字段保存从堆上开辟空间总的容量

一个指针做一些其他事情（指向字符串首地址）

故总共占16+4+4+4=28个字节。

g++下string的结构

G++下，string是通过写时拷贝实现的，string对象总共占4个字节，内部只包含了一个指针，该指针将来指向一块堆空间，内部包含了如下字段：

空间总大小

字符串有效长度

引用计数

struct _Rep_base
{
    size_type _M_length;
    size_type _M_capacity;
    _Atomic_word _M_refcount;
};

指向堆空间的指针，用来存储字符串。

3. 拷贝问题

浅拷贝：

浅拷贝：也称位拷贝，编译器只是将对象中的值拷贝过来。

如果对象中管理资源，最后就会导致多个对象共享同一份资源，

当一个对象销毁时就会将该资源释放掉，

而此时另一些对象不知道该资源已经被释放，以为还有效，

所以当继续对资源进项操作时，就会发生发生了访问违规。

所以与资源管理（空间分配）有关的拷贝一定要注意深浅拷贝的情况，判断是否要自己写拷贝函数，也就是深拷贝。

深拷贝：

如果一个类中涉及到资源的管理，其拷贝构造函数、赋值运算符重载以及析构函数必须要显式给出。一般情况都是按照深拷贝方式提供。

比如说：

#include<iostream>
using namespace std;
int main()
{
    string s1;
    string s2="chatgpt";
    s1=s2;
    return 0;
}

它的实现原理是上面呢？

实际情况如下：

每个String类对象都要用空间来存放字符串，而s1需要s2拷贝出来，这时候就要用到深拷贝了，它需要给每个对象分配独立的资源，保证他们不会因为共享资源而造成多次释放而造成程序奔溃。

写时拷贝（了解）

写时拷贝就是一种拖延症，是在浅拷贝的基础之上增加了引用计数的方式来实现的。

引用计数：用来记录资源使用者的个数。在构造时，将资源的计数给成1，每增加一个对象使用该资源，就给计数增加1，当某个对象被销毁时，先给该计数减1，然后再检查是否需要释放资源，如果计数为1，说明该对象时资源的最后一个使用者，将该资源释放；否则就不能释放，因为还有其他对象在使用该资源。

后记

感谢大家支持！！！

respect！

下篇见！

【C++ STL】string基础知识

1. 为什么要学习string类

1.1 C语言中的字符串不够好用

2. 标准库中的string类

2.1 string类(了解)

2.2 string类的常用接口说明

2.3 string类对象的容量操作

2.4string类对象的访问及遍历操作

2.5 string类对象的修改操作

2.6 string类非成员函数

3. 拷贝问题

后记

热门文章

最新文章

相关课程

相关电子书

探索云世界

热门

云计算

大数据

云原生

人工智能

数据库

开发与运维

活动广场

任务中心

训练营

直播

乘风者计划

下载

镜像站

技术资料

【C++ STL】string基础知识

1. 为什么要学习string类

1.1 C语言中的字符串不够好用

2. 标准库中的string类

2.1 string类(了解)

2.2 string类的常用接口说明

2.3 string类对象的容量操作

2.4string类对象的访问及遍历操作

2.5 string类对象的修改操作

2.6 string类非成员函数

3. 拷贝问题

后记

热门文章

最新文章

相关课程

相关电子书