STL初阶
1. 什么是STL
STL(standard template libaray-标准模板库):是C++标准库的重要组成部分,不仅是一个可复用的组件库,而且是一个包罗数据结构与算法的软件框架。
2. STL的版本
原始版本
Alexander Stepanov、Meng Lee 在惠普实验室完成的原始版本,本着开源精神,他们声明允许任何人任意运用、拷贝、修改、传播、商业使用这些代码,无需付费。唯一的条件就是也需要向原始版本一样做开源使 用。 HP版本--所有STL实现版本的始祖。
P. J. 版本
由P. J. Plauger开发,继承自HP版本,被Windows VisualC++采用,不能公开或修改,缺陷:可读性比较低, 符号命名比较怪异。
RW版本
由Rouge Wage公司开发,继承自HP版本,被C+ +Builder 采用,不能公开或修改,可读性一般。
SGI版本
由Silicon Graphics Computer Systems,Inc公司开发,继承自HP版 本。被GCC(Linux)采用,可移植性好, 可公开、修改甚至贩卖,从命名风格和编程风格上看,阅读性非常高。在学习STL的过程中,要阅读部分源代码, 主要参考的就是这个版本。3. STL的六大组件
String类
1. 为什么学习string类?
1.1 C语言中的字符串
C语言中,字符串是以'\0'结尾的一些字符的集合,为了操作方便,C标准库中提供了一些str系列的库函数,但是这些库函数与字符串是分离开的,不太符合OOP的思想,而且底层空间需要用户自己管理,稍不留神可能还会越界访问。
但是ASCII码值只适用于英文,对于中文汉字来说无法实现,这时候就出现了Unicode编码(万国码)2. 标准库中的string类(string类的用法)
2.1 string类(了解)
- 字符串是表示字符序列的类
- 标准的字符串类提供了对此类对象的支持,其接口类似于标准字符容器的接口,但添加了专门用于操作单字节字符字符串的设计特性。
- string类是使用char(即作为它的字符类型,使用它的默认char_traits和分配器类型(关于模板的更多信 息,请参阅basic_string)。
- string类是basic_string模板类的一个实例,它使用char来实例化basic_string模板类,并用char_traits和allocator作为basic_string的默认参数(根于更多的模板信息请参考basic_string)。
- 注意,这个类独立于所使用的编码来处理字节:如果用来处理多字节或变长字符(如UTF-8)的序列,这个 类的所有成员(如长度或大小)以及它的迭代器,将仍然按照字节(而不是实际编码的字符)来操作。
==总结:==
- string是表示字符串的字符串类
- 该类的接口与常规容器的接口基本相同,再添加了一些专门用来操作string的常规操作。
- string在底层实际是:basic_string模板类的别名,typedef basic_string string;
- 不能操作多字节或者变长字符的序列。
在使用string类时,必须包含#include头文件以及using namespace std;2.2 string类的常用接口说明
1. string类对象的常见构造
2. string类对象的容量操作
这边顺便提一嘴,为啥会有两个一样的接口来返回字符串的有效长度呢?
一开始string类中只有length接口,表示字符串的长度 后面出现STL库,为了使其与STL库中接口一致增加了size接口注意:
- size()与length()方法底层实现原理完全相同,引入size()的原因是为了与其他容器的接口保持一致,一般情况下基本都是用size()。
- clear()只是将string中有效字符清空,不改变底层空间大小。
resize(size_t n)
与resize(size_t n, char c)
都是将字符串中有效字符个数改变到n个,不同的是当字符个数增多时:resize(n)
用0来填充多出的元素空间,resize(size_t n, char c)
用字符c来填充多出的 元素空间。注意:resize在改变元素个数时,如果是将元素个数增多,可能会改变底层容量的大小,如果是将元素个数减少,底层空间总大小不变。reserve(size_t res_arg=0)
:为string预留空间,不改变有效元素个数,当reserve的参数小于string的底层空间总大小时,reserver不会改变容量大小。3. string类对象的访问及遍历操作
2.3 string类的使用形式
string类+-读取
string类遍历
迭代器的使用形式
capacity的使用
扩size(resize) / 扩capacity(recapacity)
==众所周知,扩容是有代价的,尤其是异地扩容,需要释放前空间,再开辟新空间==
但是,当我们知道自己所需要的空间大小可不可以一次性开辟好呢?尾插
任意位置插入/删除string(不推荐)
赋值assign / 替换replace(不推荐)
c_str
主要是为了C++兼容C语言的接口使用substr
运算符重载
3. 习题
3.1 反转字符串
3.2 字符串相加
==不停的头插,挪动的数据越来越多,时间复杂度O(N^2^)==,所以推荐尾插并逆置3.3 字符串中第一个唯一字符
3.4 字符串最后单词长度
4. vs和g++下string结构的说明
注意:下述结构是在32位平台下进行验证,32位平台下指针占4个字节。vs下string的结构
string总共占28个字节,内部结构稍微复杂一点,先是有一个联合体,联合体用来定义string中字符串的存储空间:
当字符串长度小于16时,使用内部固定的字符数组来存放
当字符串长度大于等于16时,从堆上开辟空间
这种设计也是有一定道理的,大多数情况下字符串的长度都小于16,那string对象创建好之后,内union _Bxty { // storage for small buffer or pointer to larger one value_type _Buf[_BUF_SIZE]; pointer _Ptr; char _Alias[_BUF_SIZE]; // to permit aliasing } _Bx;
部已经有了16个字符数组的固定空间,不需要通过堆创建,效率高。
其次:还有一个size_t字段保存字符串长度,一个size_t字段保存从堆上开辟空间总的容量
最后:还有一个指针做一些其他事情。
故总共占16+4+4+4=28个字节。
==VS下使用的策略其实就是以空间换时间,当长度<16的时候存储在buff当中 当长度>=16时存储在_ptr所指向的空间当中==g++下string的结构
G++下,string是通过写时拷贝实现的,string对象总共占4个字节,内部只包含了一个指针,该指针将来指向一块堆空间,内部包含了如下字段:
空间总大小
字符串有效长度
引用计数
指向堆空间的指针,用来存储字符串struct _Rep_base { size_type _M_length; size_type _M_capacity; _Atomic_word _M_refcount; };