【C++初阶:STL —— vector】vector的介绍及使用 | 迭代器失效问题 | vector的深度剖析及模拟实现 下

简介: 【C++初阶:STL —— vector】vector的介绍及使用 | 迭代器失效问题 | vector的深度剖析及模拟实现

二、vector的深度剖析及模拟实现

💦 std::vector的核心框架接口的模拟实现

注意我们模拟实现不是把源码中的内容都搬下来,搞一个一模一样的东西,也不是造一个更好的轮子。模拟实现的目的是为了学习源码中的一些细节及核心框架。

💨 vector.h

#pragma once
namespace bit
{
  template<class T>
  class vector
  {
  public:
    typedef T* iterator;
    typedef const T* const_iterator;    
    iterator begin()
    {
      return _start;
    }
    const_iterator begin() const
    {
      return _start;
    }
    iterator end()
    {
      return _finish; 
    }
    const_iterator end() const
    {
      return _finish;
    }   
    vector()
      : _start(nullptr)
      , _finish(nullptr)
      , _endofstorage(nullptr)
    {}       
    //类模板的成员函数还可以再定义模板参数,这样写的好处是first/last可以是list等其它容器的迭代器,只要它解引用后的类型与T匹配
    template<class InputIterator>
    vector(InputIterator first, InputIterator last)
      : _start(nullptr)
      , _finish(nullptr)
      , _endofstorage(nullptr)
    {
      //reserve(?)这个构造函数里传的是一段迭代器区间,只有对象才知道你有多少个容量
      while(first != last)
      {
        push_back(*first);  
        ++first;
      }
    }
    //v2(v1)
    //1、传统写法
    /*vector(const vector<T>& v)
    {
      _start = new T[v.capacity()];
      memcpy(_start, v._start, sizeof(T) * v.size());
      _finish = _start + v.size();
      _endofstorage = _start + v.capacity();
    }*/
    //2、传统写法————复用当前的一些接口,本质还是自己开空间,这里相对于现代写法更推荐第二种传统写法,因为它这里提前把空间开好了,并利用
    /*vector(const vector<T>& v)
      : _start(nullptr)
      , _finish(nullptr)
      , _endofstorage(nullptr)  
    {
      reserve(v.capacity());//一次性开好空间
      for(const auto& e : v)//引用的作用是为了防止T是string等
      {
        push_back(e);
      }
    }*/
    //3、现代写法,sring那我们是取_str来构造一个临时对象再交换,但是这里怎么取所有的数据来构造并交换呢,没有法子
    //这里有个法子:vector的构造函数里还提供了一个显示的迭代器(它可以传其它容器或原生指针做迭代器,但是原生指针必须要求指向的空间是连续的)
    //所以这里还需要构造一个函数,这里的现代写法对比上面的传统写法并没有讨到便宜()
    vector(const vector<T>& v)
      : _start(nullptr)
      , _finish(nullptr)
      , _endofstorage(nullptr)
    {
      //现代写法里提前开空间没有意义,因为现代写法的空间是tmp去搞的,tmp没办法自己开,因为它不知道有多少个数据,那有人说用last-first,不敢减,因为比如list是不支持减的,它不是一段连续的空间
      vector<T> tmp(v.begin(), v.end());
      swap(tmp);
    }
    void swap(vector<T>& v)
    {  
      std::swap(_start, v._start);
      std::swap(_finish, v._finish);
      std::swap(_endofstorage, v._endofstorage);
    }
    //v1 = v4;
    //1、传统写法————不推荐(如果你能掌握现代写法,任何容器的深拷贝都推荐现代写法,尤其是赋值操作)
    /*vector<T>& operator=(const vector<T>& v)
    {
      if(this != &v)
      {
        delete[]_start; 
        _start = _finish = _endofstorage = nullptr;
        reserve(v.capacity());
        for(const auto& e : v)
        {
          push_back(e);  
        }
      }
      return *this;
    }*/
    //2、现代写法,v就是去深拷贝的v4
    vector<T>& operator=(vector<T> v)
    {
      //v是v1想要的,所以v1和v交换
      swap(v);
      return *this;
    }
    ~vector()
    {
      delete[] _start;
      _start = _finish = _endofstorage = nullptr; 
    }
    size_t size() const
    {
      return _finish - _start;  
    }
    size_t capacity() const
    {
      return _endofstorage - _start;
    }
    T& operator[](size_t i) 
    {
      assert(i < size());
      return _start[i];
    }
    const T& operator[](size_t i) const
    {
      assert(i < size());
      return _start[i];
    }
    void reserve(size_t n)
    {
      if(n > capacity())
      {
        //备份一份
        size_t sz = size();
        T* tmp = new T[n];
        if(_start)
        {
          //对于string,memcpy会引发更深层次的浅拷贝问题,具体如下说明
          //memcpy(tmp, _start, sizeof(T) * size());
          for(size_t i = 0; i < size(); ++i)
          {
            //如果T是string,它会调用string的operator=完成深拷贝
            tmp[i] = _start[i]; 
          }
          delete[] _start;  
        }
        _start = tmp;
        _finish = _start + sz;
        //_finish = _start + size();err,size去计算时,_finish还是旧空间的_finish,而_start却是新空间的_start了,所以_finish-_start就是一个负值,再加_start就是0
        _endofstorage = _start + n;
      }
    }
    //如果没有给值,就用默认值,如果T是int,那就是int的匿名对象。T是string,那就是stirng的匿名对象。它会调用对应的默认构造函数————int是0,double是0.0,指针就是空指针
    //所以一般写一个类型,一定要提供一个不用参数就可以调的函数
    void resize(size_t n, const T& val = T())
    {
      if(n <= size())
      {
        _finish = _start + n;
      }
      else
      {
        if(n > capacity())
        {
          reserve(n); 
        } 
        while(_finish < _start + n)
        {
          *_finish = val;
          ++_finish;
        }
      }
    }
    void push_back(const T& x)
    {
      /*if(_finish == _endofstorage)
      {
        size_t newcapacity = capacity() == 0 ? 4 : capacity() * 2;
        reserve(newcapacity);
      }
      //这里不用像源码中一样使用定位new,因为使用定位new的原因是finish指向的空间没有初始化,所以使用定位new把对象构造上去。但是我们这里的对象是new出来的,所以这里直接赋值即可
      *_finish = x;
      ++_finish;*/
      insert(end(), x);
    }   
    void pop_back()
    {
      /*
      //一般情况下--finish就行了,但是特殊情况vector为空时就不好
      //所以一般需要assert
      assert(!empty());
      --_finish;*/
      erase(--end());
    }
    iterator insert(iterator pos, const T& x)
    {
      //可以=_finish,因为它相当于尾插
      assert(pos >= _start && pos <= _finish);
      if(_finish == _endofstorage)
      {
        size_t len = pos - _start;
        size_t newcapacity = capacity() == 0 ? 4 : capacity() * 2;
        //reserve里会更新那三个成员变量,insert返回新插入的那个元素的地址,所以这里的pos需要先备份一下旧空间里与_start之间的长度,然后再在新空间里重新赋值
        reserve(newcapacity); 
        pos = _start + len;
      }
      iterator end = _finish - 1;
      while(end >= pos)
      {
        *(end + 1) = *end;
        --end;  
      }
      *pos = x;
      ++_finish;
      return pos;
    }
    iterator erase(iterator pos)
    {
      assert(pos >= _start && pos < _finish);
      iterator it = pos + 1;
      while(it != _finish)
      {
        *(it - 1) = *it;
        ++it; 
      }
      --_finish;
      return pos;
    }
  private:  
    iterator _start;
    iterator _finish;
    iterator _endofstorage;
  };
  void print(const vector<int>& v)//const版本的迭代器和operator[]
  {
    vector<int>::const_iterator it = v.begin();
    while(it != v.end())
    {
      cout << *it << " ";
      ++it;
    }
    cout << endl;
    for(auto e : v)
    {
      cout << e << " "; 
    }
    cout << endl;
    for(size_t i = 0; i < v.size(); ++i)
    {
      cout << v[i] << " ";
    }
    cout << endl;
  }
  void test_vector1()
  {
    vector<int> v;
    v.push_back(1);
    v.push_back(2);
    v.push_back(3);
    v.push_back(4);
    vector<int>::iterator it = v.begin();
    while(it != v.end())
    {
      cout << *it << " ";
      ++it;
    }
    cout << endl;
    for(auto e : v)
    {
      cout << e << " "; 
    }
    cout << endl;
    for(size_t i = 0; i < v.size(); ++i)
    {
      cout << v[i] << " ";
    }
    cout << endl;
    print(v);
  }
  void test_vector2()
  {
    vector<int> v;
    v.push_back(1);
    v.push_back(2);
    v.push_back(3);
    v.push_back(4);
    for(auto e : v)
    {
      cout << e << " "; 
    }
    cout << endl;
    v.resize(2);
    for(auto e : v)
    {
      cout << e << " "; 
    }
    cout << endl;
    v.resize(4);
    for(auto e : v)
    {
      cout << e << " "; 
    }
    cout << endl;
    v.resize(10, 5);
    for(auto e : v)
    {
      cout << e << " "; 
    }
    cout << endl;
  }
  void test_vector3()
  {
    //放string
    vector<string> v;
    string s("hello");
    v.push_back(s);
    v.push_back(string("hello"));
    v.push_back("hello");
    v.push_back("hello");
    v.push_back("hello");
    v.push_back("hello");
    for(auto e : v)
    {
      cout << e << " "; 
    }
    cout << endl;
  }
  void test_vector4()
  {
    vector<int> v;
    v.push_back(1);
    v.push_back(2);
    v.push_back(3);
    v.push_back(4);
    vector<int>::iterator pos = find(v.begin(), v.end(), 2);
    if(pos != v.end())
    {
      pos = v.insert(pos, 20);  
    } 
    cout << *pos << endl;
    *pos = 100;
    ++pos;
    for(auto e : v)
    {
      cout << e << " "; 
    }
    cout << endl;
  }
  void test_vector5()
  {
    vector<int> v;
    v.push_back(1); 
    v.push_back(2);
    v.push_back(3);
    v.push_back(4);
    vector<int>::iterator pos = find(v.begin(), v.end(), 2);
    if(pos != v.end())
    {
      v.erase(pos); 
    }
    //在VS下这段代码是会崩溃的,但是我们很难做到的,但是在Linux下没有崩,所以这块我们就按Linux下实现
    cout << *pos << endl;
    *pos = 100;
  }
  void test_vector6()
  {
    vector<int> v;
    v.push_back(1); 
    v.push_back(2);
    v.push_back(3);
    v.push_back(4);
    //删除v中所有偶数
    vector<int>::iterator it = v.begin();
    while(it != v.end())
    {
      if(*it % 2 == 0)
      {
        it = v.erase(it); 
      }
      else
      {
        ++it;
      } 
    }
    for(auto e : v)
    {
      cout << e << " "; 
    }
    cout << endl;
  }
  void test_vector7()
  {
    vector<int> v1;
    v1.push_back(1);  
    v1.push_back(2);
    v1.push_back(3);
    v1.push_back(4);
    vector<int> v2(v1);
    for(auto e : v2)
    {
      cout << e << " "; 
    }
    cout << endl;
    //为什么现代写法里的构造函数的实现还需要再定义模板,而不使用T*或iterator
    //因为如果是T*的话就写死了,你是其它容器的迭代器就不行了
    string s("abcde");
    vector<int> v3(v1.begin(), v1.end());
    vector<int> v4(s.begin(), s.end()); 
    //赋值
    v1 = v4;
    for(auto e : v1)
    {
      cout << e << " "; 
    }
    cout << endl;
  }
}

💨 vector.cpp

//库里的string是一个typedef的类模板,当时在模拟的时候简化了
//这里的vector我们就实现成类模板了,在模板初阶里我们提过函数/类模板不支持把声明写到.h,定义写到.cpp的方式,会报链接错误,所以这里我们就不写vector.cpp了

💨 test.cpp

#include<memory.h>
#include<assert.h>
#include<algorithm>
#include<string>
#include<iostream>
using namespace std;
#include "vector.h"//编译器不会去编译头文件vector.h,所以vector.h里所需要的头文件都在此行之前展开就行
//以下是比较常见的错误,编译器编译的原理是头文件展开,展开后,又有一个原则,我用一个东西只会向上去查找,也就是说vector.h里用了cout,它会向上去查找定义,cout是一个全局的对象ostream,唉!那没问题呀,这就是我们之前说的编译器找的时候它只会在全局域里去找,它不会到类域、命名空间里去找,而库里的东西都在std这个域里,而此时我的std是在vector.h之后展开的,所以找不到。
//解决方法就是顺序问题————参照上面写的,或是直接指定类域
//#include<iostream>
//#include "vector.h"
//using namespace std;
int main()
{
  bit::test_vector1();
  cout << "-----------------------cut-----------------------" << endl;
  bit::test_vector2();
  cout << "-----------------------cut-----------------------" << endl;
  bit::test_vector3();
  cout << "-----------------------cut-----------------------" << endl;
  bit::test_vector4();
  cout << "-----------------------cut-----------------------" << endl;
  bit::test_vector5();
  cout << "-----------------------cut-----------------------" << endl;
  bit::test_vector6();
  cout << "-----------------------cut-----------------------" << endl;
  bit::test_vector7();
  return 0;
}

📝补充

所有的容器我们都不推荐使用传统写法,尤其是后面要学的知识,现在的结构还比较简单,是数组(开好空间,memcpy就都过去了)。后面学到 list、map、树形结构等,就深拷贝时,要把数据拷贝就不是这么简单了。

💦 使用memcpy拷贝问题

假设模拟实现的 vector 中的 reserve 接口中,使用 memcpy 进行的拷贝,以下代码会发生什么问题 ❓

vector<string> v;
string s("hello");
//第一次push,开了4块空间
v.push_back(s);
v.push_back(string("hello"));
v.push_back("hello");
v.push_back("hello");
//再次增容
v.push_back("hello");
v.push_back("hello");

在模拟实现 vector 时,还有一个深层次的浅拷贝问题:如果是 int 是不会出现问题的,问题出在 string 上,详细见下图:

注意我们以前写的拷贝构造的传统写法,包括之前的 string 也面临这种问题。

💦 对bit::vector核心接口的测试

同上 test.cpp 文件

💦 动态二维数组理解

//以杨慧三角的前n行为例:假设n为5
void test5(size_t n) 
{
  //使用vector定义二维数组vv,vv中的每个元素都是vector<int>
  bit::vector<bit::vector<int>> vv(n);
  //将二维数组每一行中的vecotr<int>中的元素全部设置为1
  for (size_t i = 0; i < n; ++i)
    vv[i].resize(i + 1, 1);
  //给杨慧三角中第一列和对角线的所有元素赋值
  for (int i = 2; i < n; ++i)
  {
    for (int j = 1; j < i; ++j)
    {
      vv[i][j] = vv[i - 1][j] + vv[i - 1][j - 1];
    }
  }
}

📝说明

bit::vector<bit::vector< int >> vv(n); 构造一个 vv 动态二维数组,vv 中总共有n 个元素,每个元素都是 vector 类型的,每行没有包含任何元素,如果 n 为 5 时如下所示:

vv 中元素填充完成之后,如下图所示:

使用标准库中 vector 构建动态二维数组时与上图实际是一致的。

相关文章
|
1天前
|
算法 编译器 C++
模拟实现c++中的vector模版
模拟实现c++中的vector模版
|
3月前
|
存储 编译器 C语言
【c++丨STL】vector的使用
本文介绍了C++ STL中的`vector`容器,包括其基本概念、主要接口及其使用方法。`vector`是一种动态数组,能够根据需要自动调整大小,提供了丰富的操作接口,如增删查改等。文章详细解释了`vector`的构造函数、赋值运算符、容量接口、迭代器接口、元素访问接口以及一些常用的增删操作函数。最后,还展示了如何使用`vector`创建字符串数组,体现了`vector`在实际编程中的灵活性和实用性。
135 4
|
2月前
|
存储 对象存储 C++
C++ 中 std::array<int, array_size> 与 std::vector<int> 的深入对比
本文深入对比了 C++ 标准库中的 `std::array` 和 `std::vector`,从内存管理、性能、功能特性、使用场景等方面详细分析了两者的差异。`std::array` 适合固定大小的数据和高性能需求,而 `std::vector` 则提供了动态调整大小的灵活性,适用于数据量不确定或需要频繁操作的场景。选择合适的容器可以提高代码的效率和可靠性。
101 0
|
2月前
|
存储 编译器 C语言
【c++丨STL】vector模拟实现
本文深入探讨了 `vector` 的底层实现原理,并尝试模拟实现其结构及常用接口。首先介绍了 `vector` 的底层是动态顺序表,使用三个迭代器(指针)来维护数组,分别为 `start`、`finish` 和 `end_of_storage`。接着详细讲解了如何实现 `vector` 的各种构造函数、析构函数、容量接口、迭代器接口、插入和删除操作等。最后提供了完整的模拟实现代码,帮助读者更好地理解和掌握 `vector` 的实现细节。
66 0
|
4月前
|
存储 C++ 索引
【C++打怪之路Lv9】-- vector
【C++打怪之路Lv9】-- vector
40 1
|
1天前
|
编译器 C语言 C++
类和对象的简述(c++篇)
类和对象的简述(c++篇)
|
1月前
|
C++ 芯片
【C++面向对象——类与对象】Computer类(头歌实践教学平台习题)【合集】
声明一个简单的Computer类,含有数据成员芯片(cpu)、内存(ram)、光驱(cdrom)等等,以及两个公有成员函数run、stop。只能在类的内部访问。这是一种数据隐藏的机制,用于保护类的数据不被外部随意修改。根据提示,在右侧编辑器补充代码,平台会对你编写的代码进行测试。成员可以在派生类(继承该类的子类)中访问。成员,在类的外部不能直接访问。可以在类的外部直接访问。为了完成本关任务,你需要掌握。
68 19
|
1月前
|
存储 编译器 数据安全/隐私保护
【C++面向对象——类与对象】CPU类(头歌实践教学平台习题)【合集】
声明一个CPU类,包含等级(rank)、频率(frequency)、电压(voltage)等属性,以及两个公有成员函数run、stop。根据提示,在右侧编辑器补充代码,平台会对你编写的代码进行测试。​ 相关知识 类的声明和使用。 类的声明和对象的声明。 构造函数和析构函数的执行。 一、类的声明和使用 1.类的声明基础 在C++中,类是创建对象的蓝图。类的声明定义了类的成员,包括数据成员(变量)和成员函数(方法)。一个简单的类声明示例如下: classMyClass{ public: int
50 13
|
1月前
|
编译器 数据安全/隐私保护 C++
【C++面向对象——继承与派生】派生类的应用(头歌实践教学平台习题)【合集】
本实验旨在学习类的继承关系、不同继承方式下的访问控制及利用虚基类解决二义性问题。主要内容包括: 1. **类的继承关系基础概念**:介绍继承的定义及声明派生类的语法。 2. **不同继承方式下对基类成员的访问控制**:详细说明`public`、`private`和`protected`继承方式对基类成员的访问权限影响。 3. **利用虚基类解决二义性问题**:解释多继承中可能出现的二义性及其解决方案——虚基类。 实验任务要求从`people`类派生出`student`、`teacher`、`graduate`和`TA`类,添加特定属性并测试这些类的功能。最终通过创建教师和助教实例,验证代码
50 5
|
1月前
|
存储 算法 搜索推荐
【C++面向对象——群体类和群体数据的组织】实现含排序功能的数组类(头歌实践教学平台习题)【合集】
1. **相关排序和查找算法的原理**:介绍直接插入排序、直接选择排序、冒泡排序和顺序查找的基本原理及其实现代码。 2. **C++ 类与成员函数的定义**:讲解如何定义`Array`类,包括类的声明和实现,以及成员函数的定义与调用。 3. **数组作为类的成员变量的处理**:探讨内存管理和正确访问数组元素的方法,确保在类中正确使用动态分配的数组。 4. **函数参数传递与返回值处理**:解释排序和查找函数的参数传递方式及返回值处理,确保函数功能正确实现。 通过掌握这些知识,可以顺利地将排序和查找算法封装到`Array`类中,并进行测试验证。编程要求是在右侧编辑器补充代码以实现三种排序算法
40 5