【C++精华铺】10.STL string模拟实现

简介: STL(标准模板库)是一个C++标准库,其中包括一些通用的算法、容器和函数对象。STL的容器是C++ STL库的重要组成部分,它们提供了一种方便的方式来管理同类型的对象。其中,STLstring是一种常用的字符串类型。STLstring是一个类,它封装了字符串的操作,并提供了一组成员函数。STLstring的实现使用了动态的内存分配技术,这意味着字符串的大小可以随时改变。STLstring还提供了一些高效的成员函数,例如substr、find、replace等,这些函数可以对字符串进行快速的操作。

1. 序言

       STL(标准模板库)是一个C++标准库,其中包括一些通用的算法、容器和函数对象。STL的容器是C++ STL库的重要组成部分,它们提供了一种方便的方式来管理同类型的对象。其中,STLstring是一种常用的字符串类型。

       STLstring是一个类,它封装了字符串的操作,并提供了一组成员函数。STLstring的实现使用了动态的内存分配技术,这意味着字符串的大小可以随时改变。STLstring还提供了一些高效的成员函数,例如substr、find、replace等,这些函数可以对字符串进行快速的操作。

       STLstring的实现主要基于字符数组。字符数组是一种固定大小的数组,其中每个元素包含一个字符。STLstring使用一个字符数组来存储字符串,并通过动态的内存分配技术来管理数组的大小。当向一个空的STLstring对象中添加字符时,STLstring会自动调整数组的大小。

       STLstring还实现了一些常见的字符串操作,例如连接字符串、查找字符串、替换字符串和分割字符串等。这些操作使用了C++ STL库中的algorithm算法,可以高效地处理字符串。同时,STLstring也提供了迭代器的支持,允许用户使用STL算法来处理字符串。

2. string类的接口实现

       在实现接口之前先要给出我们的初始类,包括三个私有成员(_size,_capacity,_str),接下来我们会对这个初始类一步一步的完善(为了文章易读后续接口函数不会展示类的全貌,只会展示实现的接口函数内容,在文章的末尾会给出完整的string类代码)如下:

namespace zybjs
{
  class string
  {
  public:
  private:
    size_t _size;
    size_t _capacity;
    char* _str;
  };
}

image.gif

2.1 构造函数

(1)默认构造和C串构造

       在STL库中将C串构造和默认构造分开实现,但是我们在模拟实现string类的时候可以将这俩个构造函数合并,这样的代码会更简洁,也方便我们自己的使用。在此之前我们先按库里面的思路走一趟:在我们给初始容量的时候即便字符串长度是0我们也不能给0,避免后续无法倍数扩容,这里我们给的是4。并且给字符串开空间的时候要比容量多一个,最后一个留给'\0'。(VS下实现思路不同,VS下给了一个16字节的字符数组_buf,如果要存储的字符串小于16字节就存放在字符数组_buf中,否则就重新开一个空间)

default (1)            string();

from c - string(2)  string(const char* s);

string()
  :_size(0)
  ,_capacity(4)  //不能给0,如果给0后续无法倍数扩容 下同
{
  _str = new char[_capacity + 1]; //开空间的时候要比容量多一个字节留给'\0',因为容量的大小不算'\0',下同
    _str[0] = '\0';
}
string(const char* str)  //const类型接收右值
  :_size(strlen(str))
{
  _capacity = _size == 0 ? 4 : _size;
  _str = new char[_capacity + 1];
  strcpy(_str, str);
}

image.gif

        但是我们在自己实现的时候大可不必这样去写,我们之前学习了缺省参数,并且全缺省的构造函数也可以作为默认构造,所以我们可以对上述代码进行优化,给str一个空串作为缺省参数,这样当我们调用的时候不给实参就会默认使用空串进行构造来完成库中”string();“的功能。如下:

string(const char* str = "")   //const类型接收右值
  :_size(strlen(str))
{
  _capacity = _size == 0 ? 4 : _size;
  _str = new char[_capacity + 1];
  strcpy(_str,str);  
}

image.gif

(2)拷贝构造

       string类的拷贝构造很简单,要注意的点有俩个:其一,string类涉及到空间管理,所以在拷贝的时候要深拷贝,否则会导致同一空间多次析构导致报错;其二,传参不能传值传参,要使用传引用传参,否则会导致无穷递归,

string(const string& s)
  :_size(s._size)
  ,_capacity(s._capacity)
{      
  //深拷贝
  _str = new char[_capacity + 1];  //重新开空间
  strcpy(_str,s._str);     //字符序列拷贝
}

image.gif

2.2 析构函数

       string类因为涉及到内存的管理,所以析构函数不能使用默认生成的析构,需要我们自己去实现析构。在实现析构的时候将_size和_capacity全部置零,然后通过delete[]释放_str就可以了。如下:

~string()
{
  delete[] _str;   //释放_str
  _str = nullptr;
  _size = _capacity = 0;
}

image.gif

2.3 size()、capacity()

       size()和capacity()很多人在实现的时候都觉得很简单反而会忽略一个点:就是const对象访问的时候是否会权限放大。因为这个俩个函数仅涉及到读取,没有修改的操作,所以我们只需要实现const版本来兼容const对象和非const对象。如下

size_t size() const  //兼容const对象和非const对象
{
  return _size;
}
size_t capacity() const//兼容const对象和非const对象
{
  return _capacity;
}

image.gif

2.4 c_str()

       返回指向一个数组的指针,该数组包含以 null 结尾的字符序列(即 C 字符串),该序列表示字符串对象的当前值。只需完成const版本来兼容const对象和非const对象。指针的返回值也需要是const char *类型,防止通过指针对对象进行修改。

const char* c_str() const 
{
  return _str;
}

image.gif

2.5 operator[]

       因为要实现类似于数组的访问方式,所以我们要实现[]的重载形式。[]的特性:能够随机访问元素,对于非const对象能够修改元素。所以operator[]要实现const版本和非const版本,const版本的返回值必须是const引用。

const char& operator[](size_t pos) const
{
  assert(pos < _size&& pos >= 0);
  return _str[pos];
}
char& operator[](size_t pos)
{
  assert(pos < _size && pos >= 0);
  return _str[pos];
}

image.gif

2.6 operator=

       赋值运算符的重载是对字符串对象的深拷贝,和拷贝构造的过程相同,但是‘=’的特性支持连续的赋值,所以我们在实现赋值重载的时候需要返回一个string对象来支持赋值重载的连续赋值。因为我们不涉及对传入参数的修改,所以我们需要传入一个const string& 类型。注意在赋值之前需要释放原来的空间。如下:

string& operator=(const string& s)
{
  if (s._str != _str)
  {
    _size = s._size;
    _capacity = s._capacity;
    //深拷贝
    char* _tmp = new char[_capacity + 1]; 
    strcpy(_tmp,s._str);
    //先释放原来的空间
    delete[] _str;
    _str = _tmp;
  }
  return *this;
}

image.gif

测试:

zybjs::string s1("cacaca");
zybjs::string s2("dadada");
zybjs::string s3("bababa");
s3 = s2 = s1;
std::cout << s1.c_str() << std::endl;
std::cout << s2.c_str() << std::endl;
std::cout << s3.c_str() << std::endl;

image.gif

image.gif编辑

2.7 字符串比较

       字符串比较我们通过strcmp来进行比较(strcmp(srt1,str2)),返回的值为0,字符串相同;返回的值大于0,str1>str2;返回的值小于0,str1<str2。基于此便可以实现字符串的比较函数。

bool operator>(const string& s) const
{
  return strcmp(_str, s._str) > 0;
}
bool operator==(const string& s) const
{
  return strcmp(_str, s._str) == 0;
}
bool operator>=(const string& s) const
{
  //return *this > s || *this == s;
  return *this > s || s == *this;
}
bool operator<(const string& s) const
{
  return !(*this >= s);
}
bool operator<=(const string& s) const
{
  return !(*this > s);
}
bool operator!=(const string& s) const
{
  return !(*this == s);
}

image.gif

2.8 迭代器实现

       string的迭代器底层是一个指针,string类的迭代器是一种用于访问字符串中字符的对象,可以通过迭代器的运算符访问字符串中的字符。迭代器为C++容器提供了一种通用的访问手段。

typedef char* iterator;
typedef const char* const_iterator;
iterator begin()
{
  //指向第一个字符的位置
  return _str;
}
iterator end()
{
  //指向最后一个字符的后一个位置
  return _str + _size;
}
const_iterator begin() const
{
  return _str;
}
const_iterator end() const
{
  return _str + _size;
}

image.gif

2.9 reserve

       reserve()是为了给对象预留空间,如果我们提前得知字符串需要的空间我们就可以提前开好,避免频繁扩容带来的性能消耗。当reserve的参数小于string底层空间大小的时候,reserve就不会对容量进行处理。

void reserve(size_t n)
{
  if (n > _capacity)
  {
    char* _tmp = new char[n+1];
    strcpy(_tmp, _str);
    delete[] _str;
    _str = _tmp;
    _capacity = n;
  }
}

image.gif

2.10 resize

         修改字符有效个数为n,多出的空间用字符ch填充。如果n小于有效字符数,本质就是删字符操作。如果容量不够会扩容。

void resize(size_t n, char ch = '\0')
{
  //当n<有效字符数的时候本质上就是删字符
  //但是我们一般不会进行缩容,在原来的空间上将n位置的字符设置为'\0'
  if (n < _size)
  {
    _size = n;
    _str[_size] = '\0';
  }
  else if (n > _size)
  {
    if (n > _capacity)  //n>_capacity就进行扩容
    {
      reserve(n);        
    }
    size_t i = _size;
    while (i < n)       //将非有效字符初始化为ch
    {
      _str[i] = ch;
      i++;
    }
    _size = n;
    _str[_size] = '\0'; //设置终止位
  }
}

image.gif

2.11 push_back、append、operator+=

       push_back尾插,append是在字符串后面追加一个字符串,实现比较简单,但要注意检查容量。

void push_back(char ch)
{
  if (_size + 1 > _capacity)
  {
    reserve(2 * _capacity);
  }
  _str[_size] = ch;
  _size++;
  _str[_size] = '\0';
}
void append(const char* str)
{
  size_t len = strlen(str);
  if (_size + len > _capacity)
  {
    reserve(_size + len);
  }
  strcpy(_str+_size,str);
  _size += len;
}

image.gif

       operator+=的功能可以由push_back和append的复用来实现:

string& operator+=(char ch)
{
  push_back(ch);
  return *this;
}
string& operator+=(const char* str)
{
  append(str);
  return *this;
}

image.gif

2.12 insert

       insert是string类中支持pos位插入字符或者字符串的函数。其中,pos表示插入的位置,返回string的引用表示插入后的新字符串。

string& insert(size_t pos, char ch)
{
  if (_size + 1 > _capacity)
  {
    reserve(2 * _capacity);
  }
  size_t n = pos;
  size_t end = _size + 1;
  while (end > pos)
  {
    _str[end] = _str[end - 1];
    end--;
  }
  _str[pos] = ch;
  _size += 1;
  _str[_size] = '\0';
  return *this;
}
string& insert(size_t pos, const char* str)
{
  size_t len = strlen(str);
  if (_size + len > _capacity)
  {
    reserve(_capacity + len);
  }
  size_t n = pos;
  size_t end = _size + 1;
  while (end > pos)
  {
    _str[end - 1 + len] = _str[end - 1];
    end--;
  }
  strncpy(_str + pos, str, len);
  _size += len;
  _str[_size] = '\0';
  return *this;
}

image.gif

2.13 erase

       C++中的string类提供了一个名为erase()的成员函数,用于删除字符串中的一部分字符并修改该字符串。该函数可以接受1个或2个参数,具体取决于要删除的字符数。如果没有显式的指定删除字符数,会使用默认的npos也就是无符号整型-1来作为缺省参数(65535),就会默认删除pos位后面所有的字符。然后返回删除字符后生成的新字符。

       首先我们要定义一个和库里相同的npos:

image.gif编辑

string& erase(size_t pos,size_t len = npos)
{
  assert(pos < _size);
  if (len >= _size - pos - 1)
  {
    _size = pos;
    _str[_size] = '\0';
  }
  else
  {
    strcpy(_str + pos, _str + pos + len);
    _size -= len;
  }
  return *this;
}

image.gif

2.14 流插入和流提取

       

std::ostream& operator<<(std::ostream& out, const string& s)
  {
    for (auto ch : s)
    {
      out << ch;
    }
    return out;
  }
  std::istream& operator>>(std::istream& in, string& s)
  {
    s.clear();        //输入之前要清空字符串
    char ch = in.get();//获取字符包括'\n'
    char buff[32];  //设置缓冲区来防止频繁扩容
    size_t i = 0;
    while (ch != ' ' && ch != '\n')
    {
      buff[i] = ch;
      if (i == 30)
      {
        buff[31] = '\0';
        s += buff;
        i = 0;
      }
      i++;
      ch = in.get();
    }
    buff[i] = '\0';
    s += buff;
  }

image.gif

3. 完整代码(均调试通过)

#pragma once
#define _CRT_SECURE_NO_WARNINGS 1
#include<iostream>
#include<cassert>
namespace zybjs
{
  class string
  {
  public:
    typedef char* iterator;
    typedef const char* const_iterator;
    iterator begin()
    {
      //指向第一个字符的位置
      return _str;
    }
    iterator end()
    {
      //指向最后一个字符的后一个位置
      return _str + _size;
    }
    const_iterator begin() const
    {
      return _str;
    }
    const_iterator end() const
    {
      return _str + _size;
    }
    //string()
    //  :_size(0)
    //  ,_capacity(4)  //不能给0,如果给0后续无法倍数扩容 下同
    //{
    //  _str = new char[_capacity + 1]; //开空间的时候要比容量多一个字节留给'\0',因为容量的大小不算'\0',下同
    //  _str[0] = '\0';
    //}
    //string(const char* str)
    //  :_size(strlen(str))
    //{
    //  _capacity = _size == 0 ? 4 : _size;
    //  _str = new char[_capacity + 1];
    //  strcpy(_str, str);
    //}
    string(const char* str = "")   //const类型接收右值
      :_size(strlen(str))
    {
      _capacity = _size == 0 ? 4 : _size;
      _str = new char[_capacity + 1];
      strcpy(_str,str);  
    }
    string(const string& s)
      :_size(s._size)
      ,_capacity(s._capacity)
    {      
      //深拷贝
      _str = new char[_capacity + 1];  //重新开空间
      strcpy(_str,s._str);     //字符序列拷贝
    }
    ~string()
    {
      delete[] _str;   //释放_str
      _str = nullptr;
      _size = _capacity = 0;
    }
    size_t size() const  //兼容const对象和非const对象
    {
      return _size;
    }
    size_t capacity() const//兼容const对象和非const对象
    {
      return _capacity;
    }
    const char* c_str() const 
    {
      return _str;
    }
    const char& operator[](size_t pos) const
    {
      assert(pos < _size&& pos >= 0);
      return _str[pos];
    }
    char& operator[](size_t pos)
    {
      assert(pos < _size && pos >= 0);
      return _str[pos];
    }
    string& operator=(const string& s)
    {
      if (s._str != _str)
      {
        _size = s._size;
        _capacity = s._capacity;
        //深拷贝
        char* _tmp = new char[_capacity + 1]; 
        strcpy(_tmp,s._str);
        //先释放原来的空间
        delete[] _str;
        _str = _tmp;
      }
      return *this;
    }
    //字符串比较
    bool operator>(const string& s) const
    {
      return strcmp(_str, s._str) > 0;
    }
    bool operator==(const string& s) const
    {
      return strcmp(_str, s._str) == 0;
    }
    bool operator>=(const string& s) const
    {
      //return *this > s || *this == s;
      return *this > s || s == *this;
    }
    bool operator<(const string& s) const
    {
      return !(*this >= s);
    }
    bool operator<=(const string& s) const
    {
      return !(*this > s);
    }
    bool operator!=(const string& s) const
    {
      return !(*this == s);
    }
    void reserve(size_t n)
    {
      if (n > _capacity)
      {
        char* _tmp = new char[n+1];
        strcpy(_tmp, _str);
        delete[] _str;
        _str = _tmp;
        _capacity = n;
      }
    }
    void resize(size_t n, char ch = '\0')
    {
      //当n<有效字符数的时候本质上就是删字符
      //但是我们一般不会进行缩容,在原来的空间上将n位置的字符设置为'\0'
      if (n < _size)
      {
        _size = n;
        _str[_size] = '\0';
      }
      else if (n > _size)
      {
        if (n > _capacity)  //n>_capacity就进行扩容
        {
          reserve(n);        
        }
        size_t i = _size;
        while (i < n)       //将非有效字符初始化为ch
        {
          _str[i] = ch;
          i++;
        }
        _size = n;
        _str[_size] = '\0'; //设置终止位
      }
    }
    void push_back(char ch)
    {
      if (_size + 1 > _capacity)
      {
        reserve(2 * _capacity);
      }
      _str[_size] = ch;
      _size++;
      _str[_size] = '\0';
    }
    void append(const char* str)
    {
      size_t len = strlen(str);
      if (_size + len > _capacity)
      {
        reserve(_size + len);
      }
      strcpy(_str+_size,str);
      _size += len;
    }
    string& operator+=(char ch)
    {
      push_back(ch);
      return *this;
    }
    string& operator+=(const char* str)
    {
      append(str);
      return *this;
    }
    string& insert(size_t pos, char ch)
    {
      if (_size + 1 > _capacity)
      {
        reserve(2 * _capacity);
      }
      size_t n = pos;
      size_t end = _size + 1;
      while (end > pos)
      {
        _str[end] = _str[end - 1];
        end--;
      }
      _str[pos] = ch;
      _size += 1;
      _str[_size] = '\0';
      return *this;
    }
    string& insert(size_t pos, const char* str)
    {
      size_t len = strlen(str);
      if (_size + len > _capacity)
      {
        reserve(_capacity + len);
      }
      size_t n = pos;
      size_t end = _size + 1;
      while (end > pos)
      {
        _str[end - 1 + len] = _str[end - 1];
        end--;
      }
      strncpy(_str + pos, str, len);
      _size += len;
      _str[_size] = '\0';
      return *this;
    }
    string& erase(size_t pos,size_t len = npos)
    {
      assert(pos < _size);
      if (len >= _size - pos - 1)
      {
        _size = pos;
        _str[_size] = '\0';
      }
      else
      {
        strcpy(_str + pos, _str + pos + len);
        _size -= len;
      }
      return *this;
    }
    void clear()
    {
      _size = 0;
      _str[_size] = '\0';
    }
  private:
    size_t _size;
    size_t _capacity;
    char* _str;
    static const size_t npos;
  };
  const size_t string::npos = -1;
  std::ostream& operator<<(std::ostream& out, const string& s)
  {
    for (auto ch : s)
    {
      out << ch;
    }
    return out;
  }
  std::istream& operator>>(std::istream& in, string& s)
  {
    s.clear();        //输入之前要清空字符串
    char ch = in.get();//获取字符包括'\n'
    char buff[32];  //设置缓冲区来防止频繁扩容
    size_t i = 0;
    while (ch != ' ' && ch != '\n')
    {
      buff[i] = ch;
      if (i == 30)
      {
        buff[31] = '\0';
        s += buff;
        i = 0;
      }
      i++;
      ch = in.get();
    }
    buff[i] = '\0';
    s += buff;
  }
}

image.gif

 

相关文章
|
5天前
|
编译器 C语言 C++
【c++丨STL】list模拟实现(附源码)
本文介绍了如何模拟实现C++中的`list`容器。`list`底层采用双向带头循环链表结构,相较于`vector`和`string`更为复杂。文章首先回顾了`list`的基本结构和常用接口,然后详细讲解了节点、迭代器及容器的实现过程。 最终,通过这些步骤,我们成功模拟实现了`list`容器的功能。文章最后提供了完整的代码实现,并简要总结了实现过程中的关键点。 如果你对双向链表或`list`的底层实现感兴趣,建议先掌握相关基础知识后再阅读本文,以便更好地理解内容。
15 1
|
17天前
|
算法 C语言 C++
【c++丨STL】list的使用
本文介绍了STL容器`list`的使用方法及其主要功能。`list`是一种双向链表结构,适用于频繁的插入和删除操作。文章详细讲解了`list`的构造函数、析构函数、赋值重载、迭代器、容量接口、元素访问接口、增删查改操作以及一些特有的操作接口如`splice`、`remove_if`、`unique`、`merge`、`sort`和`reverse`。通过示例代码,读者可以更好地理解如何使用这些接口。最后,作者总结了`list`的特点和适用场景,并预告了后续关于`list`模拟实现的文章。
33 7
|
2月前
|
存储 编译器 C语言
【c++丨STL】vector的使用
本文介绍了C++ STL中的`vector`容器,包括其基本概念、主要接口及其使用方法。`vector`是一种动态数组,能够根据需要自动调整大小,提供了丰富的操作接口,如增删查改等。文章详细解释了`vector`的构造函数、赋值运算符、容量接口、迭代器接口、元素访问接口以及一些常用的增删操作函数。最后,还展示了如何使用`vector`创建字符串数组,体现了`vector`在实际编程中的灵活性和实用性。
64 4
|
2月前
|
C语言 C++ 容器
【c++丨STL】string模拟实现(附源码)
本文详细介绍了如何模拟实现C++ STL中的`string`类,包括其构造函数、拷贝构造、赋值重载、析构函数等基本功能,以及字符串的插入、删除、查找、比较等操作。文章还展示了如何实现输入输出流操作符,使自定义的`string`类能够方便地与`cin`和`cout`配合使用。通过这些实现,读者不仅能加深对`string`类的理解,还能提升对C++编程技巧的掌握。
77 5
|
2月前
|
存储 编译器 C语言
【c++丨STL】string类的使用
本文介绍了C++中`string`类的基本概念及其主要接口。`string`类在C++标准库中扮演着重要角色,它提供了比C语言中字符串处理函数更丰富、安全和便捷的功能。文章详细讲解了`string`类的构造函数、赋值运算符、容量管理接口、元素访问及遍历方法、字符串修改操作、字符串运算接口、常量成员和非成员函数等内容。通过实例演示了如何使用这些接口进行字符串的创建、修改、查找和比较等操作,帮助读者更好地理解和掌握`string`类的应用。
60 2
|
2月前
|
存储 算法 Linux
【c++】STL简介
本文介绍了C++标准模板库(STL)的基本概念、组成部分及学习方法,强调了STL在提高编程效率和代码复用性方面的重要性。文章详细解析了STL的六大组件:容器、算法、迭代器、仿函数、配接器和空间配置器,并提出了学习STL的三个层次,旨在帮助读者深入理解和掌握STL。
58 0
|
21天前
|
存储 编译器 C语言
【c++丨STL】vector模拟实现
本文深入探讨了 `vector` 的底层实现原理,并尝试模拟实现其结构及常用接口。首先介绍了 `vector` 的底层是动态顺序表,使用三个迭代器(指针)来维护数组,分别为 `start`、`finish` 和 `end_of_storage`。接着详细讲解了如何实现 `vector` 的各种构造函数、析构函数、容量接口、迭代器接口、插入和删除操作等。最后提供了完整的模拟实现代码,帮助读者更好地理解和掌握 `vector` 的实现细节。
30 0
|
3月前
|
存储 程序员 C++
C++常用基础知识—STL库(2)
C++常用基础知识—STL库(2)
89 5
|
3月前
|
存储 安全 C++
【C++打怪之路Lv8】-- string类
【C++打怪之路Lv8】-- string类
30 1
|
2月前
|
存储 编译器 C++
【c++】类和对象(下)(取地址运算符重载、深究构造函数、类型转换、static修饰成员、友元、内部类、匿名对象)
本文介绍了C++中类和对象的高级特性,包括取地址运算符重载、构造函数的初始化列表、类型转换、static修饰成员、友元、内部类及匿名对象等内容。文章详细解释了每个概念的使用方法和注意事项,帮助读者深入了解C++面向对象编程的核心机制。
111 5