【C++初阶】STL详解(二)string类的模拟实现

本文涉及的产品
.cn 域名,1个 12个月
简介: 【C++初阶】STL详解(二)string类的模拟实现


string各函数接口总览

namespace NIC
{
  //模拟实现string类
  class string
  {
  public:
    typedef char* iterator;
    typedef const char* const_iterator;
    //默认成员函数
    string(const char* str = "");         //构造函数
    string(const string& s);              //拷贝构造函数
    string& operator=(const string& s);   //赋值运算符重载函数
    ~string();                            //析构函数
    //迭代器相关函数
    iterator begin();
    iterator end();
    const_iterator begin()const;
    const_iterator end()const;
    //容量和大小相关函数
    size_t size();
    size_t capacity();
    void reserve(size_t n);
    void resize(size_t n, char ch = '\0');
    bool empty()const;
    //修改字符串相关函数
    void push_back(char ch);
    void append(const char* str);
    string& operator+=(char ch);
    string& operator+=(const char* str);
    string& insert(size_t pos, char ch);
    string& insert(size_t pos, const char* str);
    string& erase(size_t pos, size_t len);
    void clear();
    void swap(string& s);
    const char* c_str()const;
    //访问字符串相关函数
    char& operator[](size_t i);
    const char& operator[](size_t i)const;
    size_t find(char ch, size_t pos = 0)const;
    size_t find(const char* str, size_t pos = 0)const;
    size_t rfind(char ch, size_t pos = npos)const;
    size_t rfind(const char* str, size_t pos = 0)const;
    //关系运算符重载函数
    bool operator>(const string& s)const;
    bool operator>=(const string& s)const;
    bool operator<(const string& s)const;
    bool operator<=(const string& s)const;
    bool operator==(const string& s)const;
    bool operator!=(const string& s)const;
  private:
    char* _str;       //存储字符串
    size_t _size;     //记录字符串当前的有效长度
    size_t _capacity; //记录字符串当前的容量
    static const size_t npos; //静态成员变量(整型最大值)
  };
  const size_t string::npos = -1;
  //<<和>>运算符重载函数
  istream& operator>>(istream& in, string& s);
  ostream& operator<<(ostream& out, const string& s);
  istream& getline(istream& in, string& s);
}

注:为了防止与标准库当中的string类产生命名冲突,模拟实现时需放在自己的命名空间当中。

默认成员函数:

构造函数

构造函数设置为缺省参数,若不传入参数,则默认构造为空字符串。字符串的初始大小和容量均设置为传入C字符串的长度(不包括’\0’)

//构造函数
string(const char* str = "")
  :_size(strlen(str))//初始时,字符串大小设置为字符串长度
  , _capacity(_size)///初始时,字符串容量设置为字符串长度
{
  _str = new char[_capacity + 1];//为存储字符开辟空间(多开一个用于存放'\0')
  strcpy(_str, str);//将字符串拷贝到已经开好的空间
}

拷贝构造函数

在模拟实现拷贝之前,先了解一下深浅拷贝问题:

浅拷贝:拷贝出来的目标对象的指针和源对象的指针指向的内存空间是同一块空间。其中一个对象的改动会对另一个对象造成影响。

深拷贝:深拷贝是指源对象与拷贝对象互相独立。其中任何一个对象的改动不会对另外一个对象造成影响。

很明显,我们并不希望拷贝出来的两个对象之间存在相互影响,因此,我们这里需要用到深拷贝。下面提供深拷贝的两种写法:

1.传统写法:

传统写法的思想:先开辟一块足以容纳源对象字符串的空间,然后将源对象的字符串拷贝过去,接着把源对象的其他成员变量也赋值过去即可。因为拷贝对象的_str与源对象的_str指向的并不是同一块空间,所以拷贝出来的对象与源对象是互相独立的。

// 传统写法
// s2(s1)
string(const string& s)
{
  _str = new char[s._capacity+1];
  strcpy(_str, s._str);//将s._str拷贝一份到_str
  _size = s._size;//_size赋值
  _capacity = s._capacity;//_capacity赋值
}

2.现代写法

现代写法与传统写法的思想不同:先根据源字符串的C字符串调用构造函数构造一个tmp对象,然后再将tmp对象与拷贝对象的数据交换即可。拷贝对象的_str与源对象的_str指向的也不是同一块空间,是互相独立的。

//现代写法
// s2(s1)
string(const string& s)
  :_str(nullptr)
  , _size(0)
  , _capacity(0)
{
  string tmp(s._str);//调用构造函数
  swap(tmp);//交换这两个对象
}

注:swap成员函数的模拟实现在文章的后面

析构函数

string类的析构函数需要我们进行编写,因为每个string对象中的成员_str都指向堆区的一块空间,当对象销毁时堆区对应的空间并不会自动销毁,为了避免内存泄漏,我们需要使用delete手动释放堆区的空间。

//析构函数
~string()
{
  delete[] _str;  //释放_str指向的空间
  _str = nullptr; //及时置空,防止非法访问
  _size = 0;      //大小置0
  _capacity = 0;  //容量置0
}

赋值运算符重载函数

与拷贝构造函数类似,赋值运算符重载函数的模拟实现也涉及深浅拷贝问题,我们同样需要采用深拷贝。下面也提供深拷贝的两种写法:

1.传统写法

赋值运算符重载函数的传统写法与拷贝构造函数的传统写法几乎相同,只是左值的_str在开辟新空间之前需要先将原来的空间释放掉,并且在进行操作之前还需判断是否是自己给自己赋值,若是自己给自己赋值,则无需进行任何操作。

//传统写法
string& operator=(const string& s)
{
  if (this != &s) //防止自己给自己赋值
  {
    delete[] _str; //将原来_str指向的空间释放
    _str = new char[s._capacity + 1]; //重新申请一块空间
    strcpy(_str, s._str);    //将s._str拷贝一份到_str
    _size = s._size;         //_size赋值
    _capacity = s._capacity; //_capacity赋值
  }
  return *this; //返回左值(支持连续赋值)
}

1.现代写法

赋值运算符重载函数的现代写法与拷贝构造函数的现代写法也是非常类似,但拷贝构造函数的现代写法是通过代码语句调用构造函数构造出一个对象,然后将该对象与拷贝对象交换;而赋值运算符重载函数的现代写法是通过采用“值传递”接收右值的方法,让编译器自动调用拷贝构造函数,然后我们再将拷贝出来的对象与左值进行交换即可。

//现代写法1
string& operator=(string s) //编译器接收右值的时候自动调用拷贝构造函数
{
  swap(s); //交换这两个对象
  return *this; //返回左值(支持连续赋值)
}

但这种写法无法避免自己给自己赋值,就算是自己给自己赋值这些操作也会进行,虽然操作之后对象中_str指向的字符串的内容不变,但是字符串存储的地址发生了改变,为了避免这种操作我们可以采用下面这种写法:

//现代写法2
string& operator=(const string& s)
{
  if (this != &s) //防止自己给自己赋值
  {
    string tmp(s); //用s拷贝构造出对象tmp
    swap(tmp); //交换这两个对象
  }
  return *this; //返回左值(支持连续赋值)
}

但实际中很少出现自己给自己赋值的情况,所以采用“现代写法1”就行了。

迭代器相关函数

string类中的迭代器可以认为是就是字符指针(原生指针),只是给字符指针起了一个别名叫iterator而已。但并不是说所有迭代器都是指针。

typedef char* iterator;
typedef const char* const_iterator;

begin与end

string类中的begin和end函数的实现简单,begin函数的作用就是返回字符串中第一个字符的地址:

iterator begin()
{
  return _str; //返回字符串中第一个字符的地址
}
const_iterator begin()const
{
  return _str; //返回字符串中第一个字符的const地址
}

end函数的作用就是返回字符串中最后一个字符的后一个字符的地址(即’\0’的地址):

iterator end()
{
  return _str + _size; //返回字符串中最后一个字符的后一个字符的地址
}
const_iterator end()const
{
  return _str + _size; //返回字符串中最后一个字符的后一个字符的const地址
}

在明白了string类中迭代器的底层实现,再来看看我们用迭代器遍历string的代码,其实就是用指针在遍历字符串而已。

string s("hello world!!!");
string::iterator it = s.begin();
while (it != s.end())
{
  cout << *it << " ";
  it++;
}
cout << endl;

string介绍中我们还说到,可以用范围for来遍历string,可能很多初学者都会觉得范围for是个很神奇的东西,只需要一点点代码就能实现string的遍历。

实际上范围for并不神奇,因为在代码编译的时候,编译器会自动将范围for替换为迭代器的形式,也就是说范围for是由迭代器支持的,现在我们已经实现了string类的迭代器,自然也能用范围for对string进行遍历:

string s("hello world!!!");
//编译器将其替换为迭代器形式
for (auto e : s)
{
  cout << e << " ";
}
cout << endl;

容量相关:

size和capacity

因为string类的成员变量是私有的,我们并不能直接对其进行访问,所以string类设置了size和capacity这两个成员函数,用于获取string对象的大小和容量。

size函数用于获取字符串当前的有效长度(不包括’\0’)

//大小
size_t size()const
{
  return _size; //返回字符串当前的有效长度
}

capacity函数用于获取字符串当前的容量。

//容量
size_t capacity()const
{
  return _capacity; //返回字符串当前的容量
}

reserve与resize

reserve和resize这两个函数的执行规则一定要区分清楚。

reserve规则:

 1、当n大于对象当前的capacity时,将capacity扩大到n或大于n。

 2、当n小于对象当前的capacity时,什么也不做。

//改变容量,大小不变
void reserve(size_t n)
{
  if (n > _capacity) //当n大于对象当前容量时才需执行操作
  {
    char* tmp = new char[n + 1]; //多开一个空间用于存放'\0'
    strncpy(tmp, _str, _size + 1); //将对象原本的C字符串拷贝过来(包括'\0')
    delete[] _str; //释放对象原本的空间
    _str = tmp; //将新开辟的空间交给_str
    _capacity = n; //容量跟着改变
  }
}

注意:代码中使用strncpy进行拷贝对象C字符串而不是strcpy,是为了防止对象的C字符串中含有有效字符’\0’而无法拷贝(strcpy拷贝到第一个’\0’就结束拷贝了)。

resize规则:

 1、当n大于当前的size时,将size扩大到n,扩大的字符为ch,若ch未给出,则默认为’\0’。

 2、当n小于当前的size时,将size缩小到n。

//改变大小
void resize(size_t n, char ch = '\0')
{
  if (n <= _size) //n小于当前size
  {
    _size = n; //将size调整为n
    _str[_size] = '\0'; //在size个字符后放上'\0'
  }
  else //n大于当前的size
  {
    if (n > _capacity) //判断是否需要扩容
    {
      reserve(n); //扩容
    }
    for (size_t i = _size; i < n; i++) //将size扩大到n,扩大的字符为ch
    {
      _str[i] = ch;
    }
    _size = n; //size更新
    _str[_size] = '\0'; //字符串后面放上'\0'
  }
}

empty

empty是string的判空函数,我们可以调用strcmp函数来实现,strcmp函数是用于比较两个字符串大小的函数,当两个字符串相等时返回0。

//判空
bool empty()
{
  return strcmp(_str, "") == 0;
}

注意:两个字符串相比较千万不能用 == 。

访问字符串相关函数

operator[ ]

[ ]运算符的重载是为了让string对象能像C字符串一样,通过[ ] +下标的方式获取字符串对应位置的字符。

在C字符串中我们通过[ ] +下标的方式可以获取字符串对应位置的字符,并可以对其进行修改,实现[ ] 运算符的重载时只需返回对象C字符串对应位置字符的引用即可,这样便能实现对该位置的字符进行读取和修改操作了,但需要注意在此之前检测所给下标的合法性。

//[]运算符重载(可读可写)
char& operator[](size_t i)
{
  assert(i < _size); //检测下标的合法性
  return _str[i]; //返回对应字符
}

在某些场景下,我们可能只能用[ ] +下标的方式读取字符而不能对其进行修改。

例如,对一个const的string类对象进行[ ] +下标的操作,我们只能读取所得到的字符,而不能对其进行修改。所以我们需要再重载一个[ ] 运算符,用于只读操作。

//[]运算符重载(只读)
const char& operator[](size_t i)const
{
  assert(i < _size); //检测下标的合法性
  return _str[i]; //返回对应字符
}

find和rfind

find函数和rfind函数都是用于在字符串中查找一个字符或是字符串,find函数和rfind函数分别用于正向查找和反向查找,即从字符串开头开始向后查找和从字符串末尾开始向前查找。

find函数:
1、正向查找第一个匹配的字符。

首先判断所给pos的合法性,然后通过遍历的方式从pos位置开始向后寻找目标字符,若找到,则返回其下标;若没有找到,则返回npos。(npos是string类的一个静态成员变量,其值为整型最大值)

//正向查找第一个匹配的字符
size_t find(char ch, size_t pos = 0)
{
  assert(pos < _size); //检测下标的合法性
  for (size_t i = pos; i < _size; i++) //从pos位置开始向后寻找目标字符
  {
    if (_str[i] == ch)
    {
      return i; //找到目标字符,返回其下标
    }
  }
  return npos; //没有找到目标字符,返回npos
}

2、正向查找第一个匹配的字符串。

首先也是先判断所给pos的合法性,然后我们可以通过调用strstr函数进行查找。strstr函数若是找到了目标字符串会返回字符串的起始位置,若是没有找到会返回一个空指针。若是找到了目标字符串,我们可以通过计算目标字符串的起始位置和对象C字符串的起始位置的差值,进而得到目标字符串起始位置的下标。

//正向查找第一个匹配的字符串
size_t find(const char* str, size_t pos = 0)
{
  assert(pos < _size); //检测下标的合法性
  const char* ret = strstr(_str + pos, str); //调用strstr进行查找
  if (ret) //ret不为空指针,说明找到了
  {
    return ret - _str; //返回字符串第一个字符的下标
  }
  else //没有找到
  {
    return npos; //返回npos
  }
}

rfind函数:

实现rfind函数时,我们可以考虑复用已经写好了的两个find函数,但rfind函数是从后先前找,所以我们需要将对象的C字符串逆置一下,若是查找字符串,还需将待查找的字符串逆置一下,然后调用find函数进行查找,但注意传入find函数的pos以及从find函数接收到的pos都需要镜像对称一下。

1、反向查找第一个匹配的字符。

首先我们需要用对象拷贝构造一个临时对象tmp,因为我们并不希望调用rfind函数后对象的C字符串就被逆置了。我们将tmp对象的C字符串逆置,然后将所给pos镜像对称一下再调用find函数,再将从find函数接收到的返回值镜像对称一下作为rfind函数的返回值返回即可。

//反向查找第一个匹配的字符
size_t rfind(char ch, size_t pos = npos)
{
  string tmp(*this); //拷贝构造对象tmp
  reverse(tmp.begin(), tmp.end()); //调用reverse逆置对象tmp的C字符串
  if (pos >= _size) //所给pos大于字符串有效长度
  {
    pos = _size - 1; //重新设置pos为字符串最后一个字符的下标
  }
  pos = _size - 1 - pos; //将pos改为镜像对称后的位置
  size_t ret = tmp.find(ch, pos); //复用find函数
  if (ret != npos)
    return _size - 1 - ret; //找到了,返回ret镜像对称后的位置
  else
    return npos; //没找到,返回npos
}

注:rfind函数规定,当所给的pos大于等于字符串的有效长度时,看作所给pos为字符串最后一个字符的下标。

2、反向查找第一个匹配的字符串。

首先我们还是需要用对象拷贝构造一个临时对象tmp,然后将tmp对象的C字符串逆置,同时我们还需要拷贝一份待查找的字符串,也将其逆置。然后将所给pos镜像对称一下再调用find函数。注意:此时我们将从find函数接收到的值镜面对称后,得到的是待查找字符串的最后一个字符在对象C字符串中的位置,而我们需要返回的是待查找字符串在对象C字符串中的第一个字符的位置,所以还需做进一步调整后才能作为rfind函数的返回值返回。

//反向查找第一个匹配的字符串
size_t rfind(const char* str, size_t pos = npos)
{
  string tmp(*this); //拷贝构造对象tmp
  reverse(tmp.begin(), tmp.end()); //调用reverse逆置对象tmp的C字符串
  size_t len = strlen(str); //待查找的字符串的长度
  char* arr = new char[len + 1]; //开辟arr字符串(用于拷贝str字符串)
  strcpy(arr, str); //拷贝str给arr
  size_t left = 0, right = len - 1; //设置左右指针
  //逆置字符串arr
  while (left < right)
  {
    ::swap(arr[left], arr[right]);
    left++;
    right--;
  }
  if (pos >= _size) //所给pos大于字符串有效长度
  {
    pos = _size - 1; //重新设置pos为字符串最后一个字符的下标
  }
  pos = _size - 1 - pos; //将pos改为镜像对称后的位置
  size_t ret = tmp.find(arr, pos); //复用find函数
  delete[] arr; //销毁arr指向的空间,避免内存泄漏
  if (ret != npos)
    return _size - ret - len; //找到了,返回ret镜像对称后再调整的位置
  else
    return npos; //没找到,返回npos
}

修改字符串相关函数

push_back

push_back函数的作用就是在当前字符串的后面尾插上一个字符,尾插之前首先需要判断是否需要增容,若需要,则调用reserve函数进行增容,然后再尾插字符,注意尾插完字符后需要在该字符的后方设置上’\0’,否则打印字符串的时候会出现非法访问,因为尾插的字符后方不一定就是’\0’

//尾插字符
void push_back(char ch)
{
  if (_size == _capacity) //判断是否需要增容
  {
    reserve(_capacity == 0 ? 4 : _capacity * 2); //将容量扩大为原来的两倍
  }
  _str[_size] = ch; //将字符尾插到字符串
  _str[_size + 1] = '\0'; //字符串后面放上'\0'
  _size++; //字符串的大小加一
}

实现push_back还可以直接复用下面即将实现的insert函数。

//尾插字符
void push_back(char ch)
{
  insert(_size, ch); //在字符串末尾插入字符ch
}

append

append函数的作用是在当前字符串的后面尾插一个字符串,尾插前需要判断当前字符串的空间能否容纳下尾插后的字符串,若不能,则需要先进行增容,然后再将待尾插的字符串尾插到对象的后方,因为待尾插的字符串后方自身带有’\0’,所以我们无需再在后方设置’\0’。

//尾插字符串
void append(const char* str)
{
  size_t len = _size + strlen(str); //尾插str后字符串的大小(不包括'\0')
  if (len > _capacity) //判断是否需要增容
  {
    reserve(len); //增容
  }
  strcpy(_str + _size, str); //将str尾插到字符串后面
  _size = len; //字符串大小改变
}

实现append函数也可以直接复用下面即将实现的insert函数。

//尾插字符串
void append(const char* str)
{
  insert(_size, str); //在字符串末尾插入字符串str
}

operator+=

+=运算符的重载是为了实现字符串与字符、字符串与字符串之间能够直接使用+=运算符进行尾插。

+=运算符实现字符串与字符之间的尾插直接调用push_back函数即可。

//+=运算符重载
string& operator+=(char ch)
{
  push_back(ch); //尾插字符串
  return *this; //返回左值(支持连续+=)
}

+=运算符实现字符串与字符串之间的尾插直接调用append函数即可。

//+=运算符重载
string& operator+=(const char* str)
{
  append(str); //尾插字符串
  return *this; //返回左值(支持连续+=)
}

insert

insert函数的作用是在字符串的任意位置插入字符或是字符串。

insert函数用于插入字符时,首先需要判断pos的合法性,若不合法则无法进行操作,紧接着还需判断当前对象能否容纳插入字符后的字符串,若不能则还需调用reserve函数进行扩容。插入字符的过程也是比较简单的,先将pos位置及其后面的字符统一向后挪动一位,给待插入的字符留出位置,然后将字符插入字符串即可。

//在pos位置插入字符
string& insert(size_t pos, char ch)
{
  assert(pos <= _size); //检测下标的合法性
  if (_size == _capacity) //判断是否需要增容
  {
    reserve(_capacity == 0 ? 4 : _capacity * 2); //将容量扩大为原来的两倍
  }
  char* end = _str + _size;
  //将pos位置及其之后的字符向后挪动一位
  while (end >= _str + pos)
  {
    *(end + 1) = *(end);
    end--;
  }
  _str[pos] = ch; //pos位置放上指定字符
  _size++; //size更新
  return *this;
}

insert函数用于插入字符串时,首先也是判断pos的合法性,若不合法则无法进行操作,再判断当前对象能否容纳插入该字符串后的字符串,若不能则还需调用reserve函数进行扩容。插入字符串时,先将pos位置及其后面的字符统一向后挪动len位(len为待插入字符串的长度),给待插入的字符串留出位置,然后将其插入字符串即可。

//在pos位置插入字符串
string& insert(size_t pos, const char* str)
{
  assert(pos <= _size); //检测下标的合法性
  size_t len = strlen(str); //计算需要插入的字符串的长度(不含'\0')
  if (len + _size > _capacity) //判断是否需要增容
  {
    reserve(len + _size); //增容
  }
  char* end = _str + _size;
  //将pos位置及其之后的字符向后挪动len位
  while (end >= _str + pos)
  {
    *(end + len) = *(end);
    end--;
  }
  strncpy(_str + pos, str, len); //pos位置开始放上指定字符串
  _size += len; //size更新
  return *this;
}

注意:插入字符串的时候使用strncpy,不能使用strcpy,否则会将待插入的字符串后面的’\0’也插入到字符串中。

erase

erase函数的作用是删除字符串任意位置开始的n个字符。删除字符前也需要判断pos的合法性,进行删除操作的时候分两种情况:

1、pos位置及其之后的有效字符都需要被删除。

这时我们只需在pos位置放上’\0’,然后将对象的size更新即可。

2、pos位置及其之后的有效字符只需删除一部分。

这时我们可以用后方需要保留的有效字符覆盖前方需要删除的有效字符,此时不用在字符串后方加’\0’,因为在此之前字符串末尾就有’\0’了。

//删除pos位置开始的len个字符
string& erase(size_t pos, size_t len = npos)
{
  assert(pos < _size); //检测下标的合法性
  size_t n = _size - pos; //pos位置及其后面的有效字符总数
  if (len >= n) //说明pos位置及其后面的字符都被删除
  {
    _size = pos; //size更新
    _str[_size] = '\0'; //字符串后面放上'\0'
  }
  else //说明pos位置及其后方的有效字符需要保留一部分
  {
    strcpy(_str + pos, _str + pos + len); //用需要保留的有效字符覆盖需要删除的有效字符
    _size -= len; //size更新
  }
  return *this;
}

clear函数用于将对象中存储的字符串置空,实现时直接将对象的_size置空,然后在字符串后面放上’\0’即可。

//清空字符串
void clear()
{
  _size = 0; //size置空
  _str[_size] = '\0'; //字符串后面放上'\0'
}

swap

swap函数用于交换两个对象的数据,直接调用库里的swap模板函数将对象的各个成员变量进行交换即可。

但我们若是想在这里调用库里的swap模板函数,需要在swap函数之前加上“::”(作用域限定符),告诉编译器优先在全局范围寻找swap函数,否则编译器编译时会认为你调用的是正在实现的swap函数(就近原则)。

void swap(string& s)
{
  std::swap(_str, s._str);
  std::swap(_size, s._size);
  std::swap(_capacity, s._capacity);
}

c_str

c_str函数用于获取对象C类型的字符串,实现时直接返回对象的成员变量_str即可。

//返回C类型的字符串
const char* c_str()const
{
  return _str;
}

关系运算符重载函数

关系运算符有 >、>=、<、<=、==、!= 这六个,但是对于C++中任意一个类的关系运算符重载,我们均只需重载其中的两个,剩下的四个关系运算符可以通过复用已经重载好了的两个关系运算符来实现。

例如,对于string类,我们可以选择只重载 > 和 == 这两个关系运算符

//>运算符重载
bool operator>(const string& s)const
{
  return strcmp(_str, s._str) > 0;
}
//==运算符重载
bool operator==(const string& s)const
{
  return strcmp(_str, s._str) == 0;
}

剩下的四个关系运算符的重载,就可以通过复用这两个已经重载好了的关系运算符来实现了。

//>=运算符重载
bool operator>=(const string& s)const
{
  return (*this > s) || (*this == s);
}
//<运算符重载
bool operator<(const string& s)const
{
  return !(*this >= s);
}
//<=运算符重载
bool operator<=(const string& s)const
{
  return !(*this > s);
}
//!=运算符重载
bool operator!=(const string& s)const
{
  return !(*this == s);
}

>>和<<运算符的重载以及getline函数

>>运算符的重载

重载>>运算符是为了让string对象能够像内置类型一样使用>>运算符直接输入。输入前我们需要先将对象的C字符串置空,然后从标准输入流读取字符,直到读取到’ ‘或是’\n’便停止读取。

//>>运算符的重载
istream& operator>>(istream& in, string& s)
{
  s.clear(); //清空字符串
  char ch = in.get(); //读取一个字符
  while (ch != ' '&&ch != '\n') //当读取到的字符不是空格或'\n'的时候继续读取
  {
    s += ch; //将读取到的字符尾插到字符串后面
    ch = in.get(); //继续读取字符
  }
  return in; //支持连续输入
}

<<运算符的重载

重载<<运算符是为了让string对象能够像内置类型一样使用<<运算符直接输出打印。实现时我们可以直接使用范围for对对象进行遍历即可。

//<<运算符的重载
ostream& operator<<(ostream& out, const string& s)
{
  //使用范围for遍历字符串并输出
  for (auto e : s)
  {
    cout << e;
  }
  return out; //支持连续输出
}

getline

getline函数用于读取一行含有空格的字符串。实现时于>>运算符的重载基本相同,只是当读取到’\n’的时候才停止读取字符。

//读取一行含有空格的字符串
istream& getline(istream& in, string& s)
{
  s.clear(); //清空字符串
  char ch = in.get(); //读取一个字符
  while (ch != '\n') //当读取到的字符不是'\n'的时候继续读取
  {
    s += ch; //将读取到的字符尾插到字符串后面
    ch = in.get(); //继续读取字符
  }
  return in;
}

测试相关接口函数:

测试1.对元素的访问:迭代器.c_str.与运算符重载[]

示例:

将字符串s1按照[]访问,按照迭代器访问,按照范围for访问。

void test_string1()
{
  string s1("hello world");
  cout << s1.c_str() << endl;
  string s2;
  cout << s2.c_str() << endl;
  //访问字符串
  for (size_t i = 0; i < s1.size(); i++)
  {
    cout << s1[i] ;
  }
  cout << endl;
  //迭代器
  string::iterator it = s1.begin();
  while (it != s1.end())
  {
    //写
    (*it)++;
    //读
    cout << *it << " ";
    ++it;
  }
  cout << endl;
  //范围for
  for (auto& ch : s1)
  {
    ch++;
    cout << ch << " ";
  }
  cout << endl;
  cout << s1.c_str() << endl;
}

测试结果:

测试2.修改字符串

示例:

给s1字符串插入其他字符串,用push_back与+=

void test_string2()
{
  string s1("hello world");
  cout << s1.c_str() << endl;
  s1.push_back(' ');
  s1.append("hello bit hello bit");
  cout << s1.c_str() << endl;
  s1 += '#';
  s1 += "*********************";
  cout << s1.c_str() << endl;
  string s2;
  s2 += '#';
  s2 += "*********************";
  cout << s2.c_str() << endl;
}

测试结果:

测试3.insert

示例:

测试insert

void test_string3()
{
  string s1("hello world");
  cout << s1.c_str() << endl;
  s1.insert(5, '%');
  cout << s1.c_str() << endl;
  s1.insert(s1.size(), '%');
  cout << s1.c_str() << endl;
  s1.insert(0, '%');
  cout << s1.c_str() << endl;
}

测试结果:

测试4.关系运算符与流插入流提取

示例:

比较s1与s2,输入字符串并打印

void test_string4()
{
  string s1("hello world");
  string s2("hello world");
  cout << (s1 >= s2) << endl;
  s1[0] = 'z';
  cout << (s1 >= s2) << endl;
  cout << s1 << endl;
  cin >> s1;
  cout << s1 << endl;
}

测试结果:

测试5.erase

示例:

测试rease

void test_string5()
{
  string s1("hello world");
  s1.insert(5, "abc");
  cout << s1 << endl;
  s1.insert(0, "xxx");
  cout << s1 << endl;
  s1.erase(0, 3);
  cout << s1 << endl;
  s1.erase(5, 100);
  cout << s1 << endl;
  s1.erase(2);
  cout << s1 << endl;
}

测试结果:

测试6.resize

示例:

测试resize

void test_string6()
{
  string s1("hello world");
  cout << s1 << endl;
  s1.resize(5);
  cout << s1 << endl;
  s1.resize(25, 'x');
  cout << s1 << endl;
}

测试结果:

测试7.find

示例:

将网址按照协议,域名,资源名三部分找出来。

void test_string7()
{
  string s1("test.cpp.tar.zip");
  //size_t i = s1.find('.');
  //size_t i = s1.rfind('.');
  //string s2 = s1.substr(i);
  //cout << s2 << endl;
  string s3("https://legacy.cplusplus.com/reference/string/string/rfind/");
  //string s3("ftp://www.baidu.com/?tn=65081411_1_oem_dg");
  // 协议
  // 域名
  // 资源名
  string sub1, sub2, sub3;
  size_t i1 = s3.find(':');
  if (i1 != string::npos)
    sub1 = s3.substr(0, i1);
  else
    cout << "没有找到i1" << endl;
  size_t i2 = s3.find('/', i1 + 3);
  if (i2 != string::npos)
    sub2 = s3.substr(i1 + 3, i2 - (i1 + 3));
  else
    cout << "没有找到i2" << endl;
  sub3 = s3.substr(i2 + 1);
  //域名
  cout << "协议" << endl;
  cout << sub1 << endl;
  cout << "域名" << endl;
  cout << sub2 << endl;
  cout << "资源名" << endl;
  cout << sub3 << endl;
}

测试结果:

测试8:拷贝构造

示例:

将s3拷贝给s2

void test_string8()
{
  string s1("hello world");
  string s2 = s1;
  cout << s1 << endl;
  cout << s2 << endl;
  string s3("xxxxxxxxxxxxxxxxxxx");
  s2 = s3;
  cout << s2 << endl;
  cout << s3 << endl;
}

结果:

测试9.容量与大小

示例:

计算字符串“hello world”的长度与容量

void test_string9()
{
  string s1("hello world");
  cout << s1 << endl;
  cout << s1.size() << endl;
  cout << s1.capacity() << endl;
}

结果:

string模拟实现源码

模拟实现中,我们没有进行对其定义与声明分离,将测试函数写成成员函数包装在命名空间里。

string.h

#include<assert.h>
namespace NIC
{
  class string
  {
  public:
    //迭代器相关
    typedef char* iterator;
    typedef const char* const_iterator;
    iterator begin()
    {
      return _str;//返回字符串中第一个字符的地址
    }
    iterator end()
    {
      return _str + _size; //返回字符串中最后一个字符的后一个字符的地址
    }
    const_iterator begin() const
    {
      return _str;//返回字符串中第一个字符的const地址
    }
    const_iterator end() const
    {
      return _str + _size; //返回字符串中最后一个字符的后一个字符的地址
    }
    /*string()
      :_str(new char[1]{'\0'})
      ,_size(0)
      ,_capacity(0)
    {}*/
        
    //构造函数
    string(const char* str = "")
      :_size(strlen(str))//初始时,字符串大小设置为字符串长度
      , _capacity(_size)///初始时,字符串容量设置为字符串长度
    {
      _str = new char[_capacity + 1];//为存储字符开辟空间(多开一个用于存放'\0')
      strcpy(_str, str);//将字符串拷贝到已经开好的空间
    }
     传统写法
     s2(s1)
    //string(const string& s)
    //{
    //  _str = new char[s._capacity+1];
    //  strcpy(_str, s._str);//将s._str拷贝一份到_str
    //  _size = s._size;//_size赋值
    //  _capacity = s._capacity;//_capacity赋值
    //}
    void swap(string& s)
    {
      std::swap(_str, s._str);
      std::swap(_size, s._size);
      std::swap(_capacity, s._capacity);
    }
    //现代写法
    // s2(s1)
    string(const string& s)
      :_str(nullptr)
      , _size(0)
      , _capacity(0)
    {
      string tmp(s._str);//调用构造函数
      swap(tmp);//交换这两个对象
    }
    //赋值运算符重载函数
     s2 = s3
    // 写法一:
    //string& operator=(const string& s)
    //{
    //  if (this != &s)//防止自己给自己赋值
    //  {
    //    char* tmp = new char[s._capacity + 1];
    //    strcpy(tmp, s._str);
    //    delete[] _str;
    //    _str = tmp;
    //    _size = s._size;
    //    _capacity = s._capacity;
    //  }
    //  return *this;
    //}
    //写法二:
    // s2 = s3
    //string& operator=(const string& s)
    //{
    //  if (this != &s)
    //  {
    //    string tmp(s);
    //    //this->swap(tmp);
    //    swap(tmp);
    //  }
    //  return *this;
    //}
    //写法一:
    // s2 = s3
    string& operator=(string tmp)
    {
      swap(tmp);
      return *this;
    }
    //析构函数
    ~string()
    {
      delete[] _str;//释放_str指向的空间
      _str = nullptr;//及时置空,防止非法访问
      _size = _capacity = 0;
    }
    //容量相关
    //大小
    size_t size() const
    {
      return _size;
    }
    //容量
    size_t capacity() const
    {
      return _capacity;
    }
    
    //reserve
    void reserve(size_t n)
    {
      if (n > _capacity)
      {
        char* tmp = new char[n + 1];
        strcpy(tmp, _str);
        delete[] _str;
        _str = tmp;
        _capacity = n;
      }
    }
    
    //resize
    void resize(size_t n, char ch = '\0')
    {
      if (n <= _size)//n小于当前size
      {
        _str[n] = '\0';//在size个字符后放上'\0'
        _size = n;//将size调整为n
      }
      else//n大于当前的size
      {
        reserve(n);
        while (_size < n)
        {
          _str[_size] = ch;
          ++_size;
        }
        _str[_size] = '\0';
      }
    }
    char& operator[](size_t pos)
    {
      assert(pos < _size);
      return _str[pos];
    }
    const char& operator[](size_t pos) const
    {
      assert(pos < _size);
      return _str[pos];
    }
    
    
    const char* c_str() const
    {
      return _str;
    }
    
    size_t find(char ch, size_t pos = 0)
    {
      for (size_t i = pos; i < _size; i++)
      {
        if (_str[i] == ch)
        {
          return i;
        }
      }
      return npos;
    }
    size_t find(const char* sub, size_t pos = 0)
    {
      const char* p = strstr(_str + pos, sub);
      if (p)
      {
        return p - _str;
      }
      else
      {
        return npos;
      }
    }
    string substr(size_t pos, size_t len = npos)
    {
      string s;
      size_t end = pos + len;
      if (len == npos || pos + len >= _size) // 有多少取多少
      {
        len = _size - pos;
        end = _size;
      }
      s.reserve(len);
      for (size_t i = pos; i < end; i++)
      {
        s += _str[i];
      }
      return s;
    }
    void push_back(char ch)
    {
      if (_size == _capacity)
      {
        reserve(_capacity == 0 ? 4 : _capacity * 2);
      }
      _str[_size] = ch;
      ++_size;
      _str[_size] = '\0';
    }
    void append(const char* str)
    {
      size_t len = strlen(str);
      if (_size + len > _capacity)
      {
        reserve(_size + len);
      }
      strcpy(_str + _size, str);
      _size += len;
    }
    string& operator+=(char ch)
    {
      push_back(ch);
      return *this;
    }
    string& operator+=(const char* str)
    {
      append(str);
      return *this;
    }
    // insert(0, 'x')
    void insert(size_t pos, char ch)
    {
      assert(pos <= _size);
      if (_size == _capacity)
      {
        reserve(_capacity == 0 ? 4 : _capacity * 2);
      }
      // 17:17
      size_t end = _size + 1;
      while (end > pos)
      {
        _str[end] = _str[end - 1];
        --end;
      }
      _str[pos] = ch;
      _size++;
    }
    void insert(size_t pos, const char* str)
    {
      assert(pos <= _size);
      size_t len = strlen(str);
      if (_size + len > _capacity)
      {
        reserve(_size + len);
      }
      // 挪动数据
      int end = _size;
      while (end >= (int)pos)
      {
        _str[end + len] = _str[end];
        --end;
      }
      strncpy(_str + pos, str, len);
      _size += len;
    }
    void erase(size_t pos, size_t len = npos)
    {
      assert(pos < _size);
      if (len == npos || pos + len >= _size)
      {
        _str[pos] = '\0';
        _size = pos;
      }
      else
      {
        size_t begin = pos + len;
        while (begin <= _size)
        {
          _str[begin - len] = _str[begin];
          ++begin;
        }
        _size -= len;
      }
    }
    bool operator<(const string& s) const
    {
      return strcmp(_str, s._str) < 0;
    }
    bool operator==(const string& s) const
    {
      return strcmp(_str, s._str) == 0;
    }
    bool operator<=(const string& s) const
    {
      return *this < s || *this == s;
    }
    bool operator>(const string& s) const
    {
      return !(*this <= s);
    }
    bool operator>=(const string& s) const
    {
      return !(*this < s);
    }
    bool operator!=(const string& s) const
    {
      return !(*this == s);
    }
    void clear()
    {
      _str[0] = '\0';
      _size = 0;
    }
  private:
    char* _str;
    size_t _size;
    size_t _capacity;
    //const static size_t npos = -1;  // 特例
    //const static double npos = 1.1;  // 不支持
  public:
    const static size_t npos;
  };
  const size_t string::npos = -1;
  ostream& operator<<(ostream& out, const string& s)
  {
    /*for (size_t i = 0; i < s.size(); i++)
    {
      out << s[i];
    }*/
    for (auto ch : s)
      out << ch;
    return out;
  }
  istream& operator>>(istream& in, string& s)
  {
    s.clear();
    //s.reserve(128);
    char buff[129];
    size_t i = 0;
    char ch;
    ch = in.get();
    while (ch != ' ' && ch != '\n')
    {
      buff[i++] = ch;
      if (i == 128)
      {
        buff[i] = '\0';
        s += buff;
        i = 0;
      }
      //s += ch;
      ch = in.get();
    }
    if (i != 0)
    {
      buff[i] = '\0';
      s += buff;
    }
    return in;
  }
  void test_string1()
  {
    string s1("hello world");
    cout << s1.c_str() << endl;
    string s2;
    cout << s2.c_str() << endl;
    //访问字符串
    for (size_t i = 0; i < s1.size(); i++)
    {
      cout << s1[i] ;
    }
    cout << endl;
    //迭代器
    string::iterator it = s1.begin();
    while (it != s1.end())
    {
      //写
      (*it)++;
      //读
      cout << *it << " ";
      ++it;
    }
    cout << endl;
    //范围for
    for (auto& ch : s1)
    {
      ch++;
      cout << ch << " ";
    }
    cout << endl;
    cout << s1.c_str() << endl;
  }
  void test_string2()
  {
    string s1("hello world");
    cout << s1.c_str() << endl;
    s1.push_back(' ');
    s1.append("hello bit hello bit");
    cout << s1.c_str() << endl;
    s1 += '#';
    s1 += "*********************";
    cout << s1.c_str() << endl;
    string s2;
    s2 += '#';
    s2 += "*********************";
    cout << s2.c_str() << endl;
  }
  void test_string3()
  {
    string s1("hello world");
    cout << s1.c_str() << endl;
    s1.insert(5, '%');
    cout << s1.c_str() << endl;
    s1.insert(s1.size(), '%');
    cout << s1.c_str() << endl;
    s1.insert(0, '%');
    cout << s1.c_str() << endl;
  }
  void test_string4()
  {
    string s1("hello world");
    string s2("hello world");
    cout << (s1 >= s2) << endl;
    s1[0] = 'z';
    cout << (s1 >= s2) << endl;
    cout << s1 << endl;
    cin >> s1;
    cout << s1 << endl;
    /*char ch1, ch2;
    cin >> ch1 >> ch2;*/
  }
  void test_string5()
  {
    string s1("hello world");
    s1.insert(5, "abc");
    cout << s1 << endl;
    s1.insert(0, "xxx");
    cout << s1 << endl;
    s1.erase(0, 3);
    cout << s1 << endl;
    s1.erase(5, 100);
    cout << s1 << endl;
    s1.erase(2);
    cout << s1 << endl;
  }
  void test_string6()
  {
    string s1("hello world");
    cout << s1 << endl;
    s1.resize(5);
    cout << s1 << endl;
    s1.resize(25, 'x');
    cout << s1 << endl;
  }
  void test_string7()
  {
    string s1("test.cpp.tar.zip");
    //size_t i = s1.find('.');
    //size_t i = s1.rfind('.');
    //string s2 = s1.substr(i);
    //cout << s2 << endl;
    string s3("https://legacy.cplusplus.com/reference/string/string/rfind/");
    //string s3("ftp://www.baidu.com/?tn=65081411_1_oem_dg");
    // 协议
    // 域名
    // 资源名
    string sub1, sub2, sub3;
    size_t i1 = s3.find(':');
    if (i1 != string::npos)
      sub1 = s3.substr(0, i1);
    else
      cout << "没有找到i1" << endl;
    size_t i2 = s3.find('/', i1 + 3);
    if (i2 != string::npos)
      sub2 = s3.substr(i1 + 3, i2 - (i1 + 3));
    else
      cout << "没有找到i2" << endl;
    sub3 = s3.substr(i2 + 1);
    //域名
    cout << "协议" << endl;
    cout << sub1 << endl;
    cout << "域名" << endl;
    cout << sub2 << endl;
    cout << "资源名" << endl;
    cout << sub3 << endl;
  }
  void test_string8()
  {
    string s1("hello world");
    string s2 = s1;
    cout << s1 << endl;
    cout << s2 << endl;
    string s3("xxxxxxxxxxxxxxxxxxx");
    s2 = s3;
    cout << s2 << endl;
    cout << s3 << endl;
  }
  void test_string9()
  {
    string s1("hello world");
    
    cout << s1 << endl;
    cout << s1.size() << endl;
    cout << s1.capacity() << endl;
  }
}

test.c

test.c用于测试接口函数:

#include<string>
using namespace std;
#include"string.h"
int main()
{
  NIC::test_string9();
  return 0;
}
相关文章
|
11天前
|
编译器 C语言 C++
【c++丨STL】list模拟实现(附源码)
本文介绍了如何模拟实现C++中的`list`容器。`list`底层采用双向带头循环链表结构,相较于`vector`和`string`更为复杂。文章首先回顾了`list`的基本结构和常用接口,然后详细讲解了节点、迭代器及容器的实现过程。 最终,通过这些步骤,我们成功模拟实现了`list`容器的功能。文章最后提供了完整的代码实现,并简要总结了实现过程中的关键点。 如果你对双向链表或`list`的底层实现感兴趣,建议先掌握相关基础知识后再阅读本文,以便更好地理解内容。
17 1
|
23天前
|
算法 C语言 C++
【c++丨STL】list的使用
本文介绍了STL容器`list`的使用方法及其主要功能。`list`是一种双向链表结构,适用于频繁的插入和删除操作。文章详细讲解了`list`的构造函数、析构函数、赋值重载、迭代器、容量接口、元素访问接口、增删查改操作以及一些特有的操作接口如`splice`、`remove_if`、`unique`、`merge`、`sort`和`reverse`。通过示例代码,读者可以更好地理解如何使用这些接口。最后,作者总结了`list`的特点和适用场景,并预告了后续关于`list`模拟实现的文章。
42 7
|
2月前
|
存储 编译器 C语言
【c++丨STL】vector的使用
本文介绍了C++ STL中的`vector`容器,包括其基本概念、主要接口及其使用方法。`vector`是一种动态数组,能够根据需要自动调整大小,提供了丰富的操作接口,如增删查改等。文章详细解释了`vector`的构造函数、赋值运算符、容量接口、迭代器接口、元素访问接口以及一些常用的增删操作函数。最后,还展示了如何使用`vector`创建字符串数组,体现了`vector`在实际编程中的灵活性和实用性。
72 4
|
2月前
|
C语言 C++ 容器
【c++丨STL】string模拟实现(附源码)
本文详细介绍了如何模拟实现C++ STL中的`string`类,包括其构造函数、拷贝构造、赋值重载、析构函数等基本功能,以及字符串的插入、删除、查找、比较等操作。文章还展示了如何实现输入输出流操作符,使自定义的`string`类能够方便地与`cin`和`cout`配合使用。通过这些实现,读者不仅能加深对`string`类的理解,还能提升对C++编程技巧的掌握。
86 5
|
2月前
|
存储 编译器 C语言
【c++丨STL】string类的使用
本文介绍了C++中`string`类的基本概念及其主要接口。`string`类在C++标准库中扮演着重要角色,它提供了比C语言中字符串处理函数更丰富、安全和便捷的功能。文章详细讲解了`string`类的构造函数、赋值运算符、容量管理接口、元素访问及遍历方法、字符串修改操作、字符串运算接口、常量成员和非成员函数等内容。通过实例演示了如何使用这些接口进行字符串的创建、修改、查找和比较等操作,帮助读者更好地理解和掌握`string`类的应用。
66 2
|
26天前
|
存储 编译器 C语言
【c++丨STL】vector模拟实现
本文深入探讨了 `vector` 的底层实现原理,并尝试模拟实现其结构及常用接口。首先介绍了 `vector` 的底层是动态顺序表,使用三个迭代器(指针)来维护数组,分别为 `start`、`finish` 和 `end_of_storage`。接着详细讲解了如何实现 `vector` 的各种构造函数、析构函数、容量接口、迭代器接口、插入和删除操作等。最后提供了完整的模拟实现代码,帮助读者更好地理解和掌握 `vector` 的实现细节。
33 0
|
2月前
|
存储 编译器 C++
【c++】类和对象(下)(取地址运算符重载、深究构造函数、类型转换、static修饰成员、友元、内部类、匿名对象)
本文介绍了C++中类和对象的高级特性,包括取地址运算符重载、构造函数的初始化列表、类型转换、static修饰成员、友元、内部类及匿名对象等内容。文章详细解释了每个概念的使用方法和注意事项,帮助读者深入了解C++面向对象编程的核心机制。
120 5
|
2月前
|
存储 编译器 C++
【c++】类和对象(中)(构造函数、析构函数、拷贝构造、赋值重载)
本文深入探讨了C++类的默认成员函数,包括构造函数、析构函数、拷贝构造函数和赋值重载。构造函数用于对象的初始化,析构函数用于对象销毁时的资源清理,拷贝构造函数用于对象的拷贝,赋值重载用于已存在对象的赋值。文章详细介绍了每个函数的特点、使用方法及注意事项,并提供了代码示例。这些默认成员函数确保了资源的正确管理和对象状态的维护。
124 4
|
2月前
|
存储 编译器 Linux
【c++】类和对象(上)(类的定义格式、访问限定符、类域、类的实例化、对象的内存大小、this指针)
本文介绍了C++中的类和对象,包括类的概念、定义格式、访问限定符、类域、对象的创建及内存大小、以及this指针。通过示例代码详细解释了类的定义、成员函数和成员变量的作用,以及如何使用访问限定符控制成员的访问权限。此外,还讨论了对象的内存分配规则和this指针的使用场景,帮助读者深入理解面向对象编程的核心概念。
162 4
|
3月前
|
存储 编译器 对象存储
【C++打怪之路Lv5】-- 类和对象(下)
【C++打怪之路Lv5】-- 类和对象(下)
37 4