【C++】string类@STL

简介: string类

@toc
学习STL要勤查阅此网站:cplusplus.com - The C++ Resources Network

正文开始@边通书

0. string类

string类实际上是basic_string这个类模板的实例化 ——

<img src=" title="">
它的底层实现和顺序表差不多

template<class T>
class basic_string
{
    // ...
private:
    T* _str; //动态申请的
    size_t _size;
    size_t _capacity;
    // ...
};
AI 代码解读

可能令人疑惑的是,难道字符串类型中不都是字符吗,为什么还要有类模板呢?这就要说到不同的编码规则。

在ascii编码表中,将值和符号建立映射关系,1byte空间可以表示256个英文字符;再说unicode,是为了表示全世界文字的编码表,其中的utf-16方案,所有字符,无论中英还是啥,都是两字节表示(这样计算字符个数很方便,但是能表示字符也受限)。你可以认识的到,字符可不简单的是char,还可以是wchar宽字符等等。

<img src=" title="">

(关于编码,不是这里的重点,话说昨天的CSAPP课上,老师忽然讲起了编码,讲了好久演示了好多,真的很有意思!让我忽然觉得这门课好棒,然而后来他讲起了执行三条汇编指令计算机发生了什么,太tnd底层了,都把我讲磕头了哎哈哈)

下面介绍string类常用的接口:heart: ,要熟练掌握,其余的用时查阅即可。在使用string类时,需要包含头文件#include<string>以及展开命名空间using namespace std;

1. 构造&析构&赋值重载

:heart: 1. 构造函数

[外链图片转存失败,源站可能有防盗链机制,建议将图片保存下来直接上传(img-5wNZrzHf-1646531818034)(C:\Users\13136\AppData\Roaming\Typora\typora-user-images\image-20220304191002348.png)]
调试演示 ——

<img src=" title="">

其余的接口简单演示,主要为了演示如何查阅文档。

:black_heart: 功能:从pos开始取对象的一部分(len)。

substring (3)    string (const string& str, size_t pos, size_t len = npos);
AI 代码解读

其中len给了缺省值nposnpos是string类的一个静态成员变量,值为-1,在补码中就是全1,赋给了无符号数size_t,就是整型的最大值4,294,967,295。因此,如果不传参采用缺省值,那就是有多少取多少。因为这个数字太大了42亿9千万,一个字符串就4G,可能吗?

<img src=" title="">

演示 ——

<img src=" title="">

注:string类对象支持直接用cincout进行输入和输出,因为重载了流插入>>和流提取<<操作符(后文详谈)。

:black_heart: 取字符串前n个

from sequence (5)    string (const char* s, size_t n);
AI 代码解读

<img src=" title="">

:black_heart: 填充初始化

fill (6)    string (size_t n, char c);
AI 代码解读

<img src=" title="">

:heart: 2. 析构函数

自动调用释放资源,不用管了。

:heart: 3. 赋值重载

<img src=" title="">

2. Capacity 容量操作

<img src=" title="">

2.1 size vs length

:heart:字符串中有效字符长度,即不包含最后作为结尾标识符的\0

<img src=" title="">

两者底层实现完全一致(length的存在是历史原因),但强烈推荐使用size. 这是为了和后序各种容器接口保持一致(各种容器接口表示多少个数据都用size,没有说你求二叉树的length的吧)

在这里插入图片描述

2.2 capacity

:heart: 容量存多少个有效字符(注意\0没算),要记得string类的底层是顺序表结构

<img src=" title="">

演示 ——

<img src=" title="">

2.3 resize vs reverse

reserveresize 都是改变容量,申请至少n个字符的空间(字符串涉及对齐问题,后续详谈) ,但有所不同 ——

:heart: 1. resize - 开空间,并可以对空间初始化

<img src=" title="">

  • 如果是将元素个数减少,会把多出size的字符抹去,这很符合resize这个函数的名字
  • 如果是将元素个数增多void resize (size_t n);\0来填充多出的元素空间,void resize (size_t n, char c);用字符c来填充多出的元素空间
  • 注:resize在改变元素个数时,如果是将元素个数增多,可能会改变容量的大小;如果是将元素个数size减少,容量不变。

调试可见 ——

#include<string>

using namespace std;

int main()
{
    string s1("more than words");
    s1.resize(5); // 1. size缩小到5,capacity不变

    string s2("more than words"); 
    s2.resize(100); // 2.1 填充\0 size->100, capacity ->111

    string s3("more than words");
    s3.resize(100,'!'); // 2.2 填充! size->100, capacity ->111

    return 0;
}
AI 代码解读

:heart: 2. reserve - 开空间。在已知需要多少空间时,调用reserve,可以避免频繁增容的消耗。

<img src=" title="">

  • 为字符串预留空间,改变容量。当然了不会改变有效元素个数size。
  • 当给reserve的参数n小于string的容量时,是无效请求,并不会改变容量大小。

调试可见 ——

#include<string>

using namespace std;

int main()
{
    string s1;
    s1.reserve(100); // size - 0,capcacity->111

    string s2("more than words");
    s2.reserve(5);   // capacity和size仍为15

    return 0;
}
AI 代码解读

2.5 clear

:heart: 清空有效字符,容量不变
<img src=" title="">

2.6 empty

:heart: 检测字符串是否为空串
<img src=" title="">

3. operator[]

:heart: 重载了[],使得string类可以像数组一样访问字符。不同的是,数组访问本质是解引用,而这里是调用函数。

它提供了两个版本 ——

<img src=" title="">

:heart: operator[]返回的是每个字符的引用,这使得它可读可写

引用,可以减少拷贝,但这里并不是。这里是做输出型参数,是为了支持修改返回对象

:yellow_heart: 1. 【遍历 + 修改】方法一 ——

#include<iostream>
#include<string>

using namespace std;

// 方式1:[下标]
int main()
{
    string s("more than words");
    // 1.可读
    for (size_t i = 0; i < s.size(); i++)
    {
        cout << s[i] << ' ' ;
        //等价于
        //cout << s.operator[](i) << " " <<; 
    }
    cout << endl;
    
    // 2.可写
    for (size_t i = 0; i < s.size(); i++)
    {
        s[i] += 1;
    }
    cout << s << endl;

    for (size_t i = 0; i < s.size(); i++)
    {
        s.at(i) -= 1;
    }
    cout << s << endl;
    return 0;
}
AI 代码解读

<img src=" title="">

注意:下面这两个函数功能一致(at的存在还是历史原因),只不过二者检查越界的方式不同,推荐使用[] ——

<img src=" title="">

4. Iterator 迭代器

本节将介绍第二种【遍历 + 修改】的方式:迭代器。迭代器是STL的六大组件之一,用来访问和修改这些数据结构。

看完本节你可能有这样的疑惑,对于string类,无论正着还是倒着走,[下标]的方法都足够好用,为什么还要有迭代器?

事实上,迭代器是一种通用的遍历方式,所有容器都可以使用迭代器这种方式去访问修改,而list、map/set不支持[下标]遍历。结论是,对于string类,我们得会用迭代器,但是我们更喜欢用[下标]

4.1 正向迭代器

正向迭代器提供了两个成员函数 ——

<img src=" title="">

<img src=" title="">

:heart: 迭代器是内嵌类型,想象成指针一样,但又不一定是指针

#include<iostream>
#include<string>

using namespace std;

// 2.迭代器
int main()
{
    string s("more than words");
    // 1.可读
    string::iterator it = s.begin();
    while (it != s.end())
    {
        cout << *it << " ";
        it++;
    }
    cout << endl;

    // 2.可写
    it = s.begin();
    while (it != s.end())
    {
        *it += 1;
        it++;
    }
    cout << s <<endl;
    return 0;
}
AI 代码解读

<img src=" title="">

  • [ ] iterator依然提供了两个版本,第二个是const成员函数,
  • [ ] 关于!=可不可以写成<:答案是可以但不建议。对于string类可以,是因为它的物理空间是连续的,其他容器就不一定了。

4.2 反向迭代器

反向迭代器也提供了两个成员函数 ——
在这里插入图片描述

<img src=" title="">

:heart: 倒着遍历字符串 ——

#include<iostream>
#include<string>

using namespace std;

// 反向迭代器 - 倒着遍历
int main()
{
    string s("more than words");
    // 1.可读
    string::reverse_iterator rit = s.rbegin();
    //auto rit = s.rbegin(); //太长了,可自动推导类型
    while (rit != s.rend())
    {
        cout << *rit << " ";
        rit++;
    }
    cout << endl;

    // 2.可写
    rit = s.rbegin();
    while (rit != s.rend())
    {
        *rit += 1;
        rit++;
    }
    cout << s << endl;
    return 0;
}
AI 代码解读

<img src=" title="">

4.3 const迭代器

所谓const迭代器,实际上是上面那些成员函数重载的第二个版本。

  • [ ] 上述的普通迭代器可读可写,实际上调用的是第一个接口(相当于string类模板中,类型为T*);
  • [ ] 而const迭代器不可写。这是因为是const成员函数,const修饰this指针指向的内容(相当于string类模板中,类型为const T*)

const迭代器也分正向迭代器和反向迭代器,且就是给const对象用的。这是因为const对象才能调用这里的const成员函数,返回const迭代器,不可写;是普通对象就直接调用普通的重载接口(因为两个重载函数同时存在),返回普通迭代器,可读可写。

<img src=" title="">

它出现的情况往往是这样 ——

#include<iostream>
#include<string>

using namespace std;

void func(const string& s)
{
    // const正向迭代器 - 可读不可写
    string::const_iterator it = s.begin();
    while (it != s.end())
    {
        cout << *it << " ";
        it++;
    }
    cout << endl;

    // const反向迭代器 - 可读不可写
    string::const_reverse_iterator rit = s.rbegin();
    while (rit != s.rend())
    {
        cout << *rit << " ";
        rit++;
    }
    cout << endl;
}

int main()
{
    string s("more than words");
    func(s);
    return 0;
}
AI 代码解读

传参进func中,s是const对象,自动调用第二个接口,返回的是const_iterator,要用const迭代器类型接收,且不能修改。

<img src=" title="">

C++11为了区分const迭代器和普通迭代器还提供了以下接口,不然调用时容易混淆,实际上用的不多。

<img src=" title="">

4.* 范围for遍历更改

顺便介绍【遍历 + 更改】的第三种,范围for是C++11提供的语法糖:candy:,实际上底层编译器也会替换成迭代器。

:candy: 把s中的每个字符取出来,赋值e

  • [ ] 自动向后迭代
  • [ ] 自动判断结束
#include<iostream>
#include<string>

using namespace std;

int main()
{
    string s("more than words");
    for (auto& e : s)
    {
        cout << e << " ";
    }
    cout << endl;

    for (auto& e : s)
    {
        e += 1;
    }
    cout << s << endl;
    return 0;
}
AI 代码解读

注:

  • [ ] 要修改,auto记得带上引用&。若s中的每个对象比较大,也最好加&
  • [ ] 范围for也可以不写auto,直接写类型也可。

5. Modifiers 修改

5.1 追加

<img src=" title="">

:heart: +=更常用,因为既可以追加字符、也可追加字符串 ——

int main()
{
    string s("more than words");

    s.append(" is all you have to do to make it real");
    s.push_back('~');
    cout << s << endl;

    s += "then you wouldn't have to say that you love me, cause I'd already know";
    s += "~";
    cout << s << endl;

    return 0;
}
AI 代码解读

<img src=" title="">

:heart: 下面来探究尾插扩容容量变化 ——

#include<iostream>
#include<string>

using namespace std;

int main()
{
    string s;
    //s.reserve(1000);
    size_t sz = s.capacity();
    cout << "capacity:" << sz << endl;
    for (size_t i = 0; i < 1000; i++)
    {
        s += '~';
        // 若容量发生变化
        if (capa != s.capacity())
        {
            capa = s.capacity();
            cout << "capacity changed:" << sz << endl;
        }
    }
    return 0;
}
AI 代码解读

可以看到在vs下,第一次是2倍,后面是约等于1.5倍的增容 ——

<img src=" title="">

注:在知道需要是多少空间,可以调用reserve预留空间,避免频繁增容的消耗。

<img src=" title="">

5.2 插入 & 删除

:black_heart: 尽量少用头部和中间的插入删除,因为要挪动数据,O(N)效率低。

<img src=" title="">
<img src=" title="">

6. String operations

6.1 c_str

:heart: 返回C格式字符串

<img src=" title="">

打印字符串,都能打印,但意义不同 ——

<img src=" title="">

前者是string类的流插入运算符的重载,size是多少打印多少;后者是按字符串类型打印,遇到\0结束。

主要作用还是与函数接口接合,like this——

    string file("test.txt");    
    FILE* fout = fopen(s.c_str(), "w");
AI 代码解读

<img src=" title="">

6.2 substr 子串

:heart: 取当前串的一个子串

<img src=" title="">

len:如果len比能取到的串长或使用缺省值npos,都是能取多少取多少。

6.3 查找 find & rfind

:heart: 1. 从字符串pos位置从前向后找字符c/字符串,返回该字符在字符串中的位置

<img src=" title="">

:heart: 2. 从字符串pos位置从后向前找字符c/字符串,返回该字符在字符串中的位置

<img src=" title="">

:yellow_heart: 现在我要file的后缀名 ——

#include<iostream>
#include<string>

using namespace std;

int main()
{
    string file("test.txt");
    // 获取file后缀
    size_t pos = file.rfind('.');
    if (pos != string::npos)
    {
        //string suffix = file.substr(pos, file.size() - pos);
        string suffix = file.substr(pos);
        cout << suffix << endl;
    }
    return 0;
}
AI 代码解读

<img src=" title="">

:yellow_heart: 解析出网址的这三个部分:协议 - 域名 - 资源

#include<iostream>
#include<string>

using namespace std;

int main()
{
    string url("https://cplusplus.com/reference/string/string/find/");
    size_t pos1 = url.find(':');
    string proctol = url.substr(0, pos1); //取协议子串

    size_t pos2 = url.find('/', pos1 + 3);
    string domain = url.substr(pos1 + 3, pos2 - (pos1+3)); //取域名

    string uri = url.substr(pos2); //取资源

    cout << proctol << endl;
    cout << domain << endl;
    cout << uri << endl;
    return 0;
}
AI 代码解读

<img src=" title="">

7. Non-member function overloads

7.1 流插入&流提取

注意,流插入和流提取都是以空格、回车作为结束标志的。这意味着如果想要输入一个字符串,最终可能只读入了一个单词。

于是我们引入getline.题目中就会遇到。

7.2 getline

<img src=" title="">

持续更新~@边通书

目录
打赏
0
0
0
0
59
分享
相关文章
C++ String揭秘:写高效代码的关键
在C++编程中,字符串操作是不可避免的一部分。从简单的字符串拼接到复杂的文本处理,C++的string类为开发者提供了一种更高效、灵活且安全的方式来管理和操作字符串。本文将从基础操作入手,逐步揭开C++ string类的奥秘,帮助你深入理解其内部机制,并学会如何在实际开发中充分发挥其性能和优势。
c++的string一键介绍
这篇文章旨在帮助读者回忆如何使用string,并提醒注意事项。它不是一篇详细的功能介绍,而是一篇润色文章。先展示重载函数,如果该函数一笔不可带过,就先展示英文原档(附带翻译),最后展示代码实现与举例可以直接去看英文文档,也可以看本篇文章,但是更建议去看英文原档。那么废话少说直接开始进行挨个介绍。
49 3
c++模板初阶----函数模板与类模板
class 类模板名private://类内成员声明class Apublic:A(T val):a(val){}private:T a;return 0;运行结果:注意:类模板中的成员函数若是放在类外定义时,需要加模板参数列表。return 0;
48 0
关于string的‘\0‘与string,vector构造特点,反迭代器与迭代器类等的讨论
你真的了解string的'\0'么?你知道创建一个string a("abcddddddddddddddddddddddddd", 16);这样的string对象要创建多少个对象么?你知道string与vector进行扩容时进行了怎么的操作么?你知道怎么求Vector 最大 最小值 索引 位置么?
37 0
c++的类(附含explicit关键字,友元,内部类)
本文介绍了C++中类的核心概念与用法,涵盖封装、继承、多态三大特性。重点讲解了类的定义(`class`与`struct`)、访问限定符(`private`、`public`、`protected`)、类的作用域及成员函数的声明与定义分离。同时深入探讨了类的大小计算、`this`指针、默认成员函数(构造函数、析构函数、拷贝构造、赋值重载)以及运算符重载等内容。 文章还详细分析了`explicit`关键字的作用、静态成员(变量与函数)、友元(友元函数与友元类)的概念及其使用场景,并简要介绍了内部类的特性。
119 0
【c++11】c++11新特性(上)(列表初始化、右值引用和移动语义、类的新默认成员函数、lambda表达式)
C++11为C++带来了革命性变化,引入了列表初始化、右值引用、移动语义、类的新默认成员函数和lambda表达式等特性。列表初始化统一了对象初始化方式,initializer_list简化了容器多元素初始化;右值引用和移动语义优化了资源管理,减少拷贝开销;类新增移动构造和移动赋值函数提升性能;lambda表达式提供匿名函数对象,增强代码简洁性和灵活性。这些特性共同推动了现代C++编程的发展,提升了开发效率与程序性能。
116 12
【C++进阶】特殊类设计 && 单例模式
通过对特殊类设计和单例模式的深入探讨,我们可以更好地设计和实现复杂的C++程序。特殊类设计提高了代码的安全性和可维护性,而单例模式则确保类的唯一实例性和全局访问性。理解并掌握这些高级设计技巧,对于提升C++编程水平至关重要。
101 16
|
4月前
|
《从头开始学java,一天一个知识点》之:字符串处理:String类的核心API
🌱 **《字符串处理:String类的核心API》一分钟速通!** 本文快速介绍Java中String类的3个高频API:`substring`、`indexOf`和`split`,并通过代码示例展示其用法。重点提示:`substring`的结束索引不包含该位置,`split`支持正则表达式。进一步探讨了String不可变性的高效设计原理及企业级编码规范,如避免使用`new String()`、拼接时使用`StringBuilder`等。最后通过互动解密游戏帮助读者巩固知识。 (上一篇:《多维数组与常见操作》 | 下一篇预告:《输入与输出:Scanner与System类》)
116 11
类和对象(中 )C++
本文详细讲解了C++中的默认成员函数,包括构造函数、析构函数、拷贝构造函数、赋值运算符重载和取地址运算符重载等内容。重点分析了各函数的特点、使用场景及相互关系,如构造函数的主要任务是初始化对象,而非创建空间;析构函数用于清理资源;拷贝构造与赋值运算符的区别在于前者用于创建新对象,后者用于已存在的对象赋值。同时,文章还探讨了运算符重载的规则及其应用场景,并通过实例加深理解。最后强调,若类中存在资源管理,需显式定义拷贝构造和赋值运算符以避免浅拷贝问题。
类和对象(上)(C++)
本篇内容主要讲解了C++中类的相关知识,包括类的定义、实例化及this指针的作用。详细说明了类的定义格式、成员函数默认为inline、访问限定符(public、protected、private)的使用规则,以及class与struct的区别。同时分析了类实例化的概念,对象大小的计算规则和内存对齐原则。最后介绍了this指针的工作机制,解释了成员函数如何通过隐含的this指针区分不同对象的数据。这些知识点帮助我们更好地理解C++中类的封装性和对象的实现原理。
AI助理

你好,我是AI助理

可以解答问题、推荐解决方案等

登录插画

登录以查看您的控制台资源

管理云资源
状态一览
快捷访问