【C++】STL之vector类模拟-3

简介: 【C++】STL之vector类模拟

有【insert】,那一定少不了【erase】,我们继续来看看

  • 对于【erase】来说,我们也是需要先去挪动数据的,但是在这里呢我们需要从前往后挪,也是防止造成覆盖的情况

image.png具体代码如下:


void erase(iterator pos)
{
  assert(pos >= _start && pos < _finish);
  iterator end = pos + 1;
  // 移动覆盖
  while (end != _finish)
  {
    *(end - 1) = *end;
    ++end;
  }
  --_finish;
}

立马来测试一下:

image.png💬 对于【insert】来说会存在迭代器失效的问题,那对【erase】来说也会有吗?

  • 我们立马通过下面的代码来测试一下


void test_vector8()
{
  bit::vector<int> v;
  v.push_back(1);
  v.push_back(2);
  v.push_back(3);
  v.push_back(4);
  bit::print(v);
  auto it = v.begin();
  v.erase(it);
  cout << *it << endl;
  it++;
  cout << *it << endl;
  bit::print(v);
}
  • 运行起来我们可以看到,并没有出现任何的问题,首先去删除了第一个元素,然后再访问到首个位置便是【2】,接下去再去执行it++并访问的话便是【3】

image.png

  • 但若是我们将代码换成下面这样的话就会出现问题了


auto it = v.begin() + 3;
  • 运行起来可以看到,当我们删除完最后一个元素后再让迭代器后移,就造成了访问越界的问题,出现了随机值的情况

image.png

不过呢,上面只是我们使用自己模拟的【vector】,来用用库里的会看会发生什么情况

  • 但是呢我们可以看到如果使用库里面的话就会直接造成程序崩溃的问题

image.png


💬 上面呢是在VS下的运行结果,之前有说过VS在的STL是【PJ版】,而Linux下则是【SGI版】,所以我们都要去做一个对比

  • 可以看到,神奇的事情发生了~ 在Linux下执行同样的两段代码,却没有发生像VS里面那样的报错,甚至在访问越界之后也没有出现随机值的问题,而是【0】

image.pngimage.png【小结】:

==erase以后,迭代器失效了,不能访问。VS进行强制,访问会直接报错;Linux下则不会==


然后我们再来看一个点

  • 下面这个场景是通过迭代器的形式去删除其中的偶数


auto it = v.begin();
while(it != v.end())
{
    if(*it % 2 == 0)
    {
    v.erase(it);
    }
    ++it;
}

通过运行结果我们可以看出,确实所有的偶数都被删除了

image.png换一个测试用例,我们加一个【2】,然后在删除的时候就发现【2】没有被删干净

image.png再换一个测试用例,我在最后加了一个【6】,运行之后发现报出了Segmentation fault,这是Linux下的段错误问题

image.png

我们通过画图来分析一下

  • 首先是对于第二种,根据代码来进行走读,当我们删除了第一个【2】后,后面的四个元素就往前移动了一个位置,接着迭代器++后移,就来到了【3】的位置,所以就错过了第2个【2】

image.png

  • 那对于第三种测试案例,因为最后一个是 偶数 的原因,所以在删除之后迭代器进行了后移,此时呢它已经是越过了end()的位置,再去判断的话永远都到不了,所以就出现了【Segmentation fault】的问题

image.png💬 那要如何去避免呢?

  • 这其实很简单,我们不要让这个迭代器每次都后移就可以了


auto it = v.begin();
while(it != v.end())
{
    if(*it % 2 == 0)
    {
    v.erase(it);
    }
    else
    {   
      ++it;
  }
}

再去打印看一下看看就发现没什么问题了

image.png

  • 但是呢这段代码如果放到VS上去的话就不一样了,在Linux下确实是不会出现什么问题,但是在VS下还是一样会直接报错,因为VS会进行强制检查,在访问了一次迭代器之后就不可以再继续访问了

image.png💬 此时我们需要去考虑一下【erase】这个接口的详情了

  • 我们要看的是这个返回值,其返回值是一个迭代器,而且是刚刚被删除那个元素的下一个位置


iterator erase (const_iterator position);

image.png

  • 那如果是这样的话我们就可以考虑在每次删除完一个位置的数据后拿返回值接收一下这个所删除元素的下一个位置,那么在下一次继续访问的时候就不会造成修改操作的问题了


it = v.erase(it);

image.png最后【erase】接口的整体代码如下所示:


iterator erase(iterator pos)
{
  assert(pos >= _start && pos < _finish);
  iterator end = pos + 1;
  // 移动覆盖
  while (end != _finish)
  {
    *(end - 1) = *end;
    ++end;
  }
  --_finish;
  return pos;
}

在有了【erase】之后,我们就可以让pop_back()去复用这个接口了,可以达到尾删的逻辑


void pop_back()
{
  // 复用erase
  erase(end() - 1);
}
  • 最后的话再来讲讲【swap】这个接口,很简单,就是去调用库里面的这个模版函数swap,去一一交换两个对象中的三个成员变量即可。这个接口我下面在讲【赋值重载】时会使用到


void swap(vector<T>& v)
{
  std::swap(_start, v._start);
  std::swap(_finish, v._finish);
  std::swap(_end_of_storage, v._end_of_storage);
}

5)默认成员函数

讲了这么多,终于能来讲讲默认的成员函数了

  • 首先的话一定是构造函数,有参构造是一定要实现的,因为这里的逻辑和resize()是类似的,因此我们直接去做一个复用即可


// 有参构造
vector(size_t n, const T& val = T())
{
  resize(n, val);
}
  • 那我们在构造的时候就可以去做一个初始化了,发现和v.resize(10, 0)是同样的效果


bit::vector<int> v(10, 0);

image.png💬 那有同学可能会问,三个私有成员变量不需要去做初始化吗?

  • 同学,难道你忘了我们在一开始的时候已经给到了它们初始值为nullptr吗?这个措施就是很好地避免编译器对内置类型不会去做初始化的问题


private:
  iterator _start = nullptr;
  iterator _finish = nullptr;
  iterator _end_of_storage = nullptr;

  • 除了上面这种初始化,我再介绍一种方法:那就是使用 迭代器区间

image.png

  • 这里我们可以去使用循环配合【push_back】接口去做一个初始化


// [first, last)
template<class InputIterator>
vector(InputIterator first, InputIterator last)
{
  while (first != last)
  {
    push_back(*first);
    ++first;
  }
}

💻第四轮测试 — 双重构造引发调用歧义

接下去,我们马上对这个迭代器区间做的初始化操作去所一个测试


void test_vector6()
{
  bit::vector<int> v;
  v.push_back(1);
  v.push_back(2);
  v.push_back(3);
  v.push_back(4);
  bit::vector<int> v2(v.begin(), v.end());
  string s("abcdef");
  bit::vector<int> v2(s.begin(), s.end());
  int a[] = { 1,2,3,4 };
  bit::vector<int> v2(a, a + 4);
}

可以看到,除了去初始化自己【vector】对象的迭代器区间,【string】对象也可以,而且指针也没问题

image.png💬 但此时呢,如果我再去以下面的有参构造进行初始化的话就会出现一些问题


bit::vector<int> v5(10, 1);

可以看到,说是“非法的间接寻址”

image.png

  • 这里对迭代器first去进行解引用目的就是为了获取这个位置上的数据,我们在 指针一文 有所提到 只有指针和迭代器可以解引用,基本数据类型不能解引用

💬 但是有同学一定会疑惑说:为什么这里不会去匹配有参构造,而是去匹配的迭代器区间构造呢?

  • 在讲 C++模版 的时候,我们有说到过模版参数会去进行自动类型推导,从而匹配最合适函数模版。因为我们在这里所传入的【10】和【1】都是int类型,但是呢有参构造的第一个形参类型为size_t,并不是最匹配的
  • 而迭代器区间初始化其参数类型都是模版参数,所以在匹配的时候它是最优先进行匹配的

那我们该如何去进行预防呢?

  • 很简单,我们可以利用在 C++重载函数 中所学习的参数类型不同去另写一个有参构造的重载形式


vector(size_t n, const T& val = T())
{
  resize(n, val);
}
vector(int n, const T& val = T())
{
  resize(n, val);
}

通过调试我们可以看出这里在调用的时候就没有歧义了

💬 最后再补充一个小的知识点,作为拓展

  • 那我们在写了这个重载函数后要如何去调用对应的无符号类型size_t呢,此时我们只需要在传递的参数后加上一个u即可,那么编译器在进行识别的时候就会自动将其识别成为无符号整数


bit::vector<int> v6(10u, 6);

一样通过调试来看就可以很清楚

讲完构造函数了,我们来看看拷贝构造

  • 首先读者要明确为什么要写拷贝构造,这个我们通过调试来看一下就知道了:很明显可以看到这里只是做了一个浅拷贝,而不是去做了深拷贝

image.png

  • 所以我们要自己去实现一个深拷贝,逻辑很简单,就不赘述


// 拷贝构造
vector(vector<int>& v)
{
  _start = new T[v.capacity()];
  memcpy(tmp, v._start, sizeof(T) * v.size());
  _finish = tmp + v.size();
  _end_of_storage = tmp + v.capacity();
}
  • 但是看到上面这个memcpy(),你是否会有一种警惕的心理呢,因为我们上面讲到过 vector 对象中存放的是 string数组,在拷贝的过程中会产生浅拷贝的问题,那就不可以去使用这个memcpy(),具体问题间下图

image.png

  • 所以拷贝构造的正确形式应该是下面这样的


// 拷贝构造
vector(vector<T>& v)
{
  _start = new T[v.capacity()];
  //memcpy(_start, v._start, sizeof(T) * v.size());
  for (size_t i = 0; i < v.size(); i++)
  {
    _start[i] = v._start[i];
  }
  _finish = _start + v.size();
  _end_of_storage = _start + v.capacity();
}
  • 可以看到,在改成深拷贝后就不会出现类似的问题了

image.png

  • 当然我们也可以去做一个投机取巧,复用当前已经实现过的接口【reserve】和【push_back】,首先根据所传递进来对象的容量去做一个扩容的逻辑,开出足够多的空间后再将这个对象中的数据一一尾插进当前对象即可


vector(vector<int>& v)
{
  // 根据v的capacity()去开出对应的空间
  reserve(v.capacity());
  for (size_t i = 0; i < v.size(); i++)
  {
    push_back(v[i]);
  }
}

有了拷贝构造,【赋值重载】也少不了

  • 还记得我们在上面所实现过的【swap】接口吗,在进行 string模拟 的时候,我们又使用到这么一个巧计,那就是使用 传值传参,首先会去调用一个拷贝构造构造一个临时对象,但是临时对象出了作用域之后肯定是要销毁的
  • 此时我们就可以使用【swap】和当前对象去做一个交换,我呢获取到了你里面的内容,你帮我释放了不需要的内容,简直一举两得(==还记得PUA弟弟的故事吗==😆)


// 赋值重载
const vector<T>& operator=(vector<T> v)
{
  swap(v);
  return *this;
}
  • 好,我们来调试观察一下。看到在调用赋值重载前就会去 调用拷贝构造

最后的舞台,给到【析构函数】,再怎么花里胡哨,最后最后空间都是要还给操作系统的


~vector()
{
  delete[] _start;
  _start = _finish = _end_of_storage = nullptr;
}

四、总结与提炼

最后来总结一下本文所学习的内容

  • 本文我们重点讲到的是STL中的 vector类,首先我们初步认识了这个类,逐个地去了解了它的一些接口函数,包括【默认成员函数】、【访问及遍历操作】、【常见容量操作】、【修改操作】这些,对于 vector 来说它不像 string 那样有一百来个接口,而是只有几十个,我又精简地挑了一些比较重要的来进行详述,我所讲到的希望读者都可以学会使用并且搞懂
  • 但是呢,光简单地了解这些接口还不行,我们要 “知其然,知其所以然”,带着读者把常用的接口都模拟实现了一遍,加强了我们对底层的了解,读者也可以试着在阅读完本文后试着自己去实现一遍,加深印象

上就是本文要介绍的所有内容,感谢您的阅读🌹🌹🌹

相关文章
|
11天前
|
算法 C语言 C++
【c++丨STL】list的使用
本文介绍了STL容器`list`的使用方法及其主要功能。`list`是一种双向链表结构,适用于频繁的插入和删除操作。文章详细讲解了`list`的构造函数、析构函数、赋值重载、迭代器、容量接口、元素访问接口、增删查改操作以及一些特有的操作接口如`splice`、`remove_if`、`unique`、`merge`、`sort`和`reverse`。通过示例代码,读者可以更好地理解如何使用这些接口。最后,作者总结了`list`的特点和适用场景,并预告了后续关于`list`模拟实现的文章。
27 7
|
28天前
|
存储 编译器 C语言
【c++丨STL】vector的使用
本文介绍了C++ STL中的`vector`容器,包括其基本概念、主要接口及其使用方法。`vector`是一种动态数组,能够根据需要自动调整大小,提供了丰富的操作接口,如增删查改等。文章详细解释了`vector`的构造函数、赋值运算符、容量接口、迭代器接口、元素访问接口以及一些常用的增删操作函数。最后,还展示了如何使用`vector`创建字符串数组,体现了`vector`在实际编程中的灵活性和实用性。
54 4
|
29天前
|
C语言 C++ 容器
【c++丨STL】string模拟实现(附源码)
本文详细介绍了如何模拟实现C++ STL中的`string`类,包括其构造函数、拷贝构造、赋值重载、析构函数等基本功能,以及字符串的插入、删除、查找、比较等操作。文章还展示了如何实现输入输出流操作符,使自定义的`string`类能够方便地与`cin`和`cout`配合使用。通过这些实现,读者不仅能加深对`string`类的理解,还能提升对C++编程技巧的掌握。
72 5
|
29天前
|
存储 编译器 C语言
【c++丨STL】string类的使用
本文介绍了C++中`string`类的基本概念及其主要接口。`string`类在C++标准库中扮演着重要角色,它提供了比C语言中字符串处理函数更丰富、安全和便捷的功能。文章详细讲解了`string`类的构造函数、赋值运算符、容量管理接口、元素访问及遍历方法、字符串修改操作、字符串运算接口、常量成员和非成员函数等内容。通过实例演示了如何使用这些接口进行字符串的创建、修改、查找和比较等操作,帮助读者更好地理解和掌握`string`类的应用。
51 2
|
10天前
|
存储 对象存储 C++
C++ 中 std::array<int, array_size> 与 std::vector<int> 的深入对比
本文深入对比了 C++ 标准库中的 `std::array` 和 `std::vector`,从内存管理、性能、功能特性、使用场景等方面详细分析了两者的差异。`std::array` 适合固定大小的数据和高性能需求,而 `std::vector` 则提供了动态调整大小的灵活性,适用于数据量不确定或需要频繁操作的场景。选择合适的容器可以提高代码的效率和可靠性。
31 0
|
1月前
|
存储 编译器 C++
【c++】类和对象(下)(取地址运算符重载、深究构造函数、类型转换、static修饰成员、友元、内部类、匿名对象)
本文介绍了C++中类和对象的高级特性,包括取地址运算符重载、构造函数的初始化列表、类型转换、static修饰成员、友元、内部类及匿名对象等内容。文章详细解释了每个概念的使用方法和注意事项,帮助读者深入了解C++面向对象编程的核心机制。
104 5
|
1月前
|
存储 算法 Linux
【c++】STL简介
本文介绍了C++标准模板库(STL)的基本概念、组成部分及学习方法,强调了STL在提高编程效率和代码复用性方面的重要性。文章详细解析了STL的六大组件:容器、算法、迭代器、仿函数、配接器和空间配置器,并提出了学习STL的三个层次,旨在帮助读者深入理解和掌握STL。
52 0
|
14天前
|
存储 编译器 C语言
【c++丨STL】vector模拟实现
本文深入探讨了 `vector` 的底层实现原理,并尝试模拟实现其结构及常用接口。首先介绍了 `vector` 的底层是动态顺序表,使用三个迭代器(指针)来维护数组,分别为 `start`、`finish` 和 `end_of_storage`。接着详细讲解了如何实现 `vector` 的各种构造函数、析构函数、容量接口、迭代器接口、插入和删除操作等。最后提供了完整的模拟实现代码,帮助读者更好地理解和掌握 `vector` 的实现细节。
27 0
|
1月前
|
存储 编译器 C++
【c++】类和对象(中)(构造函数、析构函数、拷贝构造、赋值重载)
本文深入探讨了C++类的默认成员函数,包括构造函数、析构函数、拷贝构造函数和赋值重载。构造函数用于对象的初始化,析构函数用于对象销毁时的资源清理,拷贝构造函数用于对象的拷贝,赋值重载用于已存在对象的赋值。文章详细介绍了每个函数的特点、使用方法及注意事项,并提供了代码示例。这些默认成员函数确保了资源的正确管理和对象状态的维护。
92 4
|
1月前
|
存储 编译器 Linux
【c++】类和对象(上)(类的定义格式、访问限定符、类域、类的实例化、对象的内存大小、this指针)
本文介绍了C++中的类和对象,包括类的概念、定义格式、访问限定符、类域、对象的创建及内存大小、以及this指针。通过示例代码详细解释了类的定义、成员函数和成员变量的作用,以及如何使用访问限定符控制成员的访问权限。此外,还讨论了对象的内存分配规则和this指针的使用场景,帮助读者深入理解面向对象编程的核心概念。
110 4