【C++】vector介绍+模拟实现-阿里云开发者社区

本章博客是对vector的介绍，有需要借鉴即可。

vector详情链接：LINK

1.vector介绍

vector的嵌套定义

vector支持嵌套自定义类型使用，即一个vector里面每个元素也可以嵌套进另一个vector…当然也可以是其他类型

eg1:vector < string >

eg2:vector<vector>

具体来说，以示例2来举例，编译器先根据模板开辟出一个vector< int >，之后再根据这个vector< int >开一个vector<vector< int >>出来。

vector调用[][]与二维数组[][]的底层区别

在语法上，我们可以定义一个vector<vector< int >>和一个二维数组，如下：

#include<vector>
vector<vector<int>> vv;
int arr[5][10];
//调用：
vv[i][j];
arr[i][j];

那这两个调用方式有什么区别呢？

在语法上看，形式是一致的
在底层实现上，是不一致的

二维数组是解引用指针来做到访问的
vector则是连续调用两个[]重载函数来实现访问的

可以通过做下面题目来进行体会：

杨辉三角:LINK

//参考题解：
class Solution {
public:
    vector<vector<int>> generate(int numRows) 
    {
        vector<vector<int>> ret;
        
        //开空间
        ret.resize(numRows);
        for(size_t i = 0; i < numRows; i++)
        {
            ret[i].resize(i+1);
        }
        //给值
        for(size_t i = 0; i < ret.size(); i++)
        {
            for(size_t j = 0; j <= i; j++)
            {
                if(j == 0 || j == i)
                {
                    ret[i][j] = 1;
                }
                else
                {
                    ret[i][j] = ret[i-1][j] + ret[i-1][j-1];
                }
            }
        }
        return ret;
    }
};

2.vector模拟

2.1vector模拟代码

从一些开源的vector源文件中可以了解到，vector是由迭代器进行维护的。所以下面整体的模拟实现逻辑是用到了三个简化的迭代器指针来对vector进行维护。

#define _CRT_SECURE_NO_WARNINGS 1
#include<iostream>
#include<assert.h>
using namespace std;
namespace bit
{
  template<typename T>
  class vector
  {
  private:
    typedef T* iterator;
    typedef const T* const_iterator;
    iterator _start;
    iterator _finish;
    iterator _endofstorage;
  public:
    //构造函数
    //无参
    vector()
      :_start(nullptr)
      , _finish(nullptr)
      , _endofstorage(nullptr)
    {}
    //拷贝构造
    // v2(v1)
    vector(const vector<T>& v)
      :_start(nullptr)
      , _finish(nullptr)
      , _endofstorage(nullptr)
    {
      reserve(v.capacity());
      for (auto& e : v)
      {
        push_back(e);
      }
    }
    //迭代器构造函数
    template<typename InputIterator>
    vector(InputIterator first, InputIterator last)//会根据传进来的参数自动推导类型,至于为什么不用T，因为写T一定是得传与类对象一致的参数，但是这样另改一个参数可以传其他的参数
    {
      while (first != last)
      {
        push_back(*first);
        first++;
      }
    }
    //用n个值初始化，构造函数
    vector(size_t n, const T& val= T())//注意：经典调用问题
    {
      reserve(n);
      for (size_t i = 0; i < n; i++)
      {
        push_back(val);
      }
    }
    vector(int n, const T& val= T())//注意：经典调用问题
    {
      reserve(n);
      for (int i = 0; i < n; i++)
      {
        push_back(val);
      }
    }
    //C++11新语法
    // vector<int> v1 = { 1,2,3,4,5,6,7,8,9,10 };
    vector(initializer_list<T> il)
    {
      reserve(il.size());
      for (auto& e : il)
      {
        push_back(e);
      }
    }
    //赋值运算符重载
    // v1 = v3
    void swap(vector<T>& v)
    {
      std::swap(this->_start, v._start);
      std::swap(this->_finish, v._finish);
      std::swap(this->_endofstorage, v._endofstorage);
    }
    vector<T>& operator=(vector<T> v)
    {
      swap(v);
      return *this;
    }
    //析构函数
    ~vector()
    {
      delete[] _start;
      _start = _finish = _endofstorage = nullptr;
    }
    //迭代器
    iterator begin()
    {
      return _start;
    }
    iterator end()
    {
      return _finish;
    }
    const_iterator begin() const
    {
      return _start;
    }
    const_iterator end() const
    {
      return _finish;
    }
    bool empty()
    {
      return _finish == _start;
    }
    //size与capacity
    const size_t size() const
    {
      return _finish - _start;
    }
    const size_t capacity() const
    {
      return _endofstorage - _start;
    }
    //resize
    void resize(size_t n, const T& val = T())//内置类型有默认构造
    {
      if (n > capacity())
      {
        //扩容
        reserve(n);
        //填入数据
        while (_finish < _start + n)
        {
          *_finish = val;
          _finish++;
        }
      }
      else
      {
        //对其他视而不见
        _finish = _start + n;
      }
    }
    //开空间
    void reserve(size_t n)
    {
      if (n > capacity())
      {
        size_t old_size = size();
        //申请一块新空间
        iterator temp = new T[n];
        //把值原来的值拷贝过去
        //memcpy(temp, _start, sizeof(T) * size());//深拷贝大坑，如果里面仍然是一个需要深拷贝的类型的话，那么这个地方就会指向同一块空间，到时候析构就直接崩溃。
        for (size_t i = 0; i < old_size; i++)
        {
          temp[i] = _start[i];//这样就可以调用类对象的拷贝构造，而对应的类对象的拷贝构造是用深拷贝去做的。
        }
        //销毁原来的空间
        delete[] _start;
        //把新空间赋给类
        _start = temp;
        _finish = temp + old_size;//但是注意，这个size已经不是我们需要的size了，所以要在之前处理一下
        _endofstorage = temp + n;
      }
    }
    //尾插
    void push_back(const T& val)
    {
      insert(_finish, val);//直接复用insert
    }
    //任意插入
    void insert(iterator pos, const T& val)
    {
      //断言
      assert(pos <= _finish && pos >= _start);
      //扩容
      if (_finish == _endofstorage)
      {
        size_t len = pos - _start;
        reserve(capacity() == 0 ? 4 : 2 * capacity());
        // 如果扩容了要更新pos --> 迭代器失效！！！其实也可以在下面直接去更新pos指针
        pos = _start + len;
      }
      //移动数据
      iterator it = _finish - 1;//这个时候指向的是最后一个有效元素
      while (it >= pos)
      {
        *(it + 1) = *it;
        --it;
      }
      //插入数据
      *pos = val;
      //更新一下finish指针
      _finish++;
    }
    //删除
    //任意删除
    iterator erase(iterator pos)
    {
      //断言
      assert(pos < _finish && pos >= _start);
      //移动数据
      iterator it = pos + 1;
      while (it < _finish)
      {
        *(it - 1) = *it;
        it++;
      }
      _finish--;
      return pos;
    }
    //尾删
    void pop_back()
    {
      assert(!empty());
      --_finish;
    }
    //可读可写
    T& operator[](size_t pos)
    {
      assert(pos < size());
      return *(_start + pos);
    }
    //仅可读
    const T& operator[](size_t pos) const
    {
      assert(pos < size());
      return *(_start + pos);
    }
  };
}
int main()
{
  //bit::vector<int> v;
  /*v.insert(v.begin(), 5);
  v.insert(v.begin(), 4);
  v.insert(v.begin(), 3);
  v.insert(v.begin(), 2);
  v.insert(v.begin(), 1);*/
  //bit::vector<int> v2;
  //v2 = v;
  //std::string str("123456");
  /*bit::vector<int> v(10, 3);*/
  
  /*bit::vector<int> v = { 1,2,3,4,5,6 };
  for (size_t i = 0; i < v.size(); i++)
  {
    cout << v[i] << " ";
  }
  cout << endl;*/
  bit::vector<string> vs;
  vs.push_back("hello");
  vs.push_back("hello");
  vs.push_back("hello");
  vs.push_back("hello");
  vs.push_back("hello");
  vs.push_back("hello");
  vs.push_back("hello");
  for (size_t i = 0; i < vs.size(); i++)
  {
    cout << vs[i] << " ";
  }
  cout << endl;
  //8：外面的迭代器有可能会因为扩容的缘故而失效，每次使用前应该再次更新迭代器而不是直接进行使用之前使用过的。
  //9：erase也有可能会因为迭代器问题失效而崩溃
  return 0;
}

2.2reserve扩容的细节

细节一：迭代器失效问题

错误代码示例：

//开空间
void reserve(size_t n)
{
  if (n > capacity())
  {
    //申请一块新空间
    iterator temp = new T[n];
    //把值原来的值拷贝过去
    //memcpy(temp, _start, sizeof(T) * size());//深拷贝大坑，如果里面仍然是一个需要深拷贝的类型的话，那么这个地方就会指向同一块空间，到时候析构就直接崩溃。
    for (size_t i = 0; i < old_size; i++)
    {
      temp[i] = _start[i];//这样就可以调用类对象的拷贝构造，而对应的类对象的拷贝构造是用深拷贝去做的。
    }
    //销毁原来的空间
    delete[] _start;
    //把新空间赋给类
    _start = temp;
    _finish = temp + size();//但是注意，这个size已经不是我们需要的size了，所以要在之前处理一下
    _endofstorage = temp + n;
  }
}

问题：这个主要是_finish看着是更新了，但是并没有更新的缘故，因为_finish更新的结果是错误的，这个_finish是之前空间的地址，所以这个地方是个坑。

那该怎么处理呢？

改正：算相对位置，在释放完原空间之后再根据相对位置old_size来推算_finish的指向。

改正代码示例：

//开空间
void reserve(size_t n)
{
  if (n > capacity())
  {
    size_t old_size = size();
    //申请一块新空间
    iterator temp = new T[n];
    //把值原来的值拷贝过去
    //memcpy(temp, _start, sizeof(T) * size());//深拷贝大坑，如果里面仍然是一个需要深拷贝的类型的话，那么这个地方就会指向同一块空间，到时候析构就直接崩溃。
    for (size_t i = 0; i < old_size; i++)
    {
      temp[i] = _start[i];//这样就可以调用类对象的拷贝构造，而对应的类对象的拷贝构造是用深拷贝去做的。
    }
    //销毁原来的空间
    delete[] _start;
    //把新空间赋给类
    _start = temp;
    _finish = temp + old_size;//但是注意，这个size已经不是我们需要的size了，所以要在之前处理一下
    _endofstorage = temp + n;
  }
}

细节二：reserve的深层浅层拷贝问题

错误代码示例：

//开空间
void reserve(size_t n)
{
  if (n > capacity())
  {
    size_t old_size = size();
    //申请一块新空间
    iterator temp = new T[n];
    //把值原来的值拷贝过去
    memcpy(temp, _start, sizeof(T) * size());//深拷贝大坑，如果里面仍然是一个需要深拷贝的类型的话，那么这个地方就会指向同一块空间，到时候析构就直接崩溃。
    
    //销毁原来的空间
    delete[] _start;
    //把新空间赋给类
    _start = temp;
    _finish = temp + old_size;//但是注意，这个size已经不是我们需要的size了，所以要在之前处理一下
    _endofstorage = temp + n;
  }
}

问题：这个问题主要是memcpy是进行按照字节进行浅层拷贝的一个库函数，如果拷贝的内容需要深层拷贝，用memcpy会直接崩溃，崩溃的原因在于两次析构同一块地址。

改正：出错的原因在于memcpy的浅拷贝问题，我们可以调用需要拷贝类的对应深层拷贝构造去处理。下面就是去调用对应的赋值函数，其赋值函数的实现逻辑是用深层拷贝实现的。

改正代码：

//开空间
void reserve(size_t n)
{
  if (n > capacity())
  {
    size_t old_size = size();
    //申请一块新空间
    iterator temp = new T[n];
    //把值原来的值拷贝过去
    //memcpy(temp, _start, sizeof(T) * size());//深拷贝大坑，如果里面仍然是一个需要深拷贝的类型的话，那么这个地方就会指向同一块空间，到时候析构就直接崩溃。
    for (size_t i = 0; i < old_size; i++)
    {
      temp[i] = _start[i];//这样就可以调用类对象的拷贝构造，而对应的类对象的拷贝构造是用深拷贝去做的。
    }
    //销毁原来的空间
    delete[] _start;
    //把新空间赋给类
    _start = temp;
    _finish = temp + old_size;//但是注意，这个size已经不是我们需要的size了，所以要在之前处理一下
    _endofstorage = temp + n;
  }
}

2.3insert函数细节

问题：这个insert有一个点值得注意，就是在扩容之后，他就会重新开空间进行拷贝嘛，但是insert中要记得及时更新pos指针，不然这个pos指针还是指向原位置。

错误代码示例：

改正：这个简单，扩容之后及时更新一下pos指针就行了。

改正代码示例：

2.4构造函数细节

上面实现的那一堆构造函数其实有个坑

问题：当存在一个构造模板和一个构造函数时候，可能会出现编译器调用不符合我们期望的问题。

比如：vector v1(10, 1);这个地方关键是因为vector v1(10, 1)函数模板和函数构造都可以匹配，只不过说模板更好一些而已

错误示例：

改正：参考库源码的实现，直接对第二个函数进行int重载就行了。

改正示例：下面第三个函数就是直接重载实现的。

//迭代器构造函数
template<typename InputIterator>
vector(InputIterator first, InputIterator last)//会根据传进来的参数自动推导类型,至于为什么不用T，因为写T一定是得传与类对象一致的参数，但是这样另改一个参数可以传其他的参数
{
  while (first != last)
  {
    push_back(*first);
    first++;
  }
}
//用n个值初始化，构造函数
vector(size_t n, const T& val= T())//注意：经典调用问题
{
  reserve(n);
  for (size_t i = 0; i < n; i++)
  {
    push_back(val);
  }
}
vector(int n, const T& val= T())//注意：经典调用问题
{
  reserve(n);
  for (int i = 0; i < n; i++)
  {
    push_back(val);
  }
}

思考：这个第一个构造函数为什么实现为模板的形式呢？

这个地方主要是为了兼容其他容器的迭代器。

比如：

string str("abcd");
    vector<int> v3(str.begin(), str.end());
    print_vector(v3);

2.5CPP11构造函数解释

从上面那一堆构造代码中，我们可以发现这样一个构造函数代码：

//C++11新语法
// vector<int> v1 = { 1,2,3,4,5,6,7,8,9,10 };
vector(initializer_list<T> il)
{
  reserve(il.size());
  for (auto& e : il)
  {
    push_back(e);
  }
}

解释：这个主要是为了实现CPP11的一个新语法，这个语法可以实现花括号整体构造的效果，vector库中是新实现了一个类进行实现的，当然我模拟实现的这个也是直接调用的库中实现的一个类。

具体用法如下：

底层：实际底层上，这个玩意就是通过两个指针进行维护的，一个指向花括号的第一个元素，第二个指针指向最后一个元素，因为空间上是连续进行存储的，所以说可以用迭代器挨个遍历就行了。

2.6单参数的构造函数支持隐式类型转换

比如下面：

解释：

一般来说，我们如果push进vector一个字符串，需要大概两个动作，一是把“”字符串先构造出一个string对象，然后再将其拷贝构造到push_back函数中作为形参。

但是呢，这个时候因为单参数构造函数支持隐式类型转换的缘故，所以直接把“”字符串隐式转换为string，然后直接进行调用构造函数。

这个隐式类型转换大大方便了我们写代码，这里简单一提。

2.7迭代器失效问题

我们模拟实现的整个victor底层都是用三个迭代器进行维护的，一旦迭代器出问题，那就很可能会挂。

结论1：外面的迭代器有可能会因为扩容的缘故而失效，每次使用前应该再次更新迭代器而不是直接进行使用之前使用过的。

比如说：

解释：这里的失效原因就是扩容时候新开了一块空间，虽然里面的迭代器及时进行更新了，但是外面的迭代器it没有及时进行更新，还摁着旧空间进行访问，自然会出问题了。

结论2：erase也有可能会因为迭代器问题失效而崩溃

比如说下面有例子：让你删除偶数并且打印出来

通过上面例子可以发现，三组例子出现了三个不同的结果。

原因：这个问题本质上就是迭代器失效问题。

怎么办改正呢？

改正：库函数给出了答案。每次删除元素之后返回最新的迭代器即可。

所以然后我们可以修改一下我们的模拟erase()的代码：

iterator erase(iterator pos)
{
  //断言
  assert(pos < _finish && pos >= _start);
  //移动数据
  iterator it = pos + 1;
  while (it < _finish)
  {
    *(it - 1) = *it;
    it++;
  }
  _finish--;
  return pos;
}

下次调用完erase之后更新一下调用的迭代器指针就行了哈。

3.总结

其实有一定基础的话写得出victor的简化模拟还可以凑合一下的，不过其中的一些细节需要把握一下。

EOF

【C++】vector介绍+模拟实现

1.vector介绍

vector的嵌套定义

vector调用[][]与二维数组[][]的底层区别

2.vector模拟

2.1vector模拟代码

2.2reserve扩容的细节

2.3insert函数细节

2.4构造函数细节

2.5CPP11构造函数解释

2.6单参数的构造函数支持隐式类型转换

2.7迭代器失效问题

3.总结

热门文章

最新文章

相关课程

相关电子书

热门

活动广场

任务中心

开发者评测

高校计划

乘风者计划

训练营

阿里云MVP

话题

直播

下载

镜像站

技术资料

插件

【C++】vector介绍+模拟实现

1.vector介绍

vector的嵌套定义

vector调用[][]与二维数组[][]的底层区别

2.vector模拟

2.1vector模拟代码

2.2reserve扩容的细节

2.3insert函数细节

2.4构造函数细节

2.5CPP11构造函数解释

2.6单参数的构造函数支持隐式类型转换

2.7迭代器失效问题

3.总结

热门文章

最新文章

相关课程

相关电子书