STL中vector的用法以及模拟实现-阿里云开发者社区

一、vector的介绍及使用

1、vector的介绍

vector是表示可变大小数组的序列容器。
就像数组一样，vector也采用的连续存储空间来存储元素。也就是意味着可以采用下标对vector的元素进行访问，和数组一样高效。但是又不像数组，它的大小是可以动态改变的，而且它的大小会被容器自动处理。
本质讲，vector使用动态分配数组来存储它的元素。当新元素插入时候，这个数组需要被重新分配大小为了增加存储空间。其做法是，分配一个新的数组，然后将全部元素移到这个数组。就时间而言，这是一个相对代价高的任务，因为每当一个新的元素加入到容器的时候，vector并不会每次都重新分配大小。
vector分配空间策略：vector会分配一些额外的空间以适应可能的增长，因为存储空间比实际需要的存储空间更大。不同的库采用不同的策略权衡空间的使用和重新分配。但是无论如何，重新分配都应该是对数增长的间隔大小，以至于在末尾插入一个元素的时候是在常数时间的复杂度完成的。
因此，vector占用了更多的存储空间，为了获得管理存储空间的能力，并且以一种有效的方式动态增长。
与其它动态序列容器相比（deques, lists and forward_lists）， vector在访问元素的时候更加高效，在末尾添加和删除元素相对高效。对于其它不在末尾的删除和插入操作，效率更低。比起lists和forward_lists统一的迭代器和引用更好。

2、vector的使用

2.1 vector的定义

构造函数	说明
vector()	无参构造
vector（size_type n, const value_type& val = value_type()）	构造并初始化n个val

vector (const vector& x)	拷贝构造
vector (InputIterator first, InputIterator last)	利用迭代器区间构造

用法：

// constructing vectors
#include <iostream>
#include <vector>
int main ()
{
  // constructors used in the same order as described above:
  std::vector<int> first; // empty vector of ints
  std::vector<int> second (4,100); // four ints with value 100
  std::vector<int> third (second.begin(),second.end()); // iterating through second
  std::vector<int> fourth (third); // a copy of third
  // 下面涉及迭代器初始化的部分，我们学习完迭代器再来看这部分
  // the iterator constructor can also be used to construct from arrays:
  int myints[] = {16,2,77,29};
  std::vector<int> fifth (myints, myints + sizeof(myints) / sizeof(int) );
  std::cout << "The contents of fifth are:";
  for (std::vector<int>::iterator it = fifth.begin(); it != fifth.end(); ++it)
    std::cout << ' ' << *it;
  std::cout << '\n';
  return 0; 
}

2.2 vector iterator 的使用

begin和end图示：
rbegin和rend图示：
用法举例：

#include <iostream>
#include <vector>
using namespace std;
void PrintVector(const vector<int>& v)
{
  // const对象使用const迭代器进行遍历打印
  vector<int>::const_iterator it = v.begin();
  while (it != v.end())
  {
    cout << *it << " ";
    ++it;
  }
  cout << endl;
}
int main()
{
  // 使用push_back插入4个数据
  vector<int> v;
  v.push_back(1);
  v.push_back(2);
  v.push_back(3);
  v.push_back(4);
  // 使用迭代器进行遍历打印
  vector<int>::iterator it = v.begin();
  while (it != v.end())
  {
    cout << *it << " ";
    ++it;
    cout << endl;
    // 使用迭代器进行修改
    it = v.begin();
    while (it != v.end())
    {
      *it *= 2;
      ++it;
    }
    // 使用反向迭代器进行遍历再打印
    vector<int>::reverse_iterator rit = v.rbegin();
    while (rit != v.rend())
    {
      cout << *rit << " ";
      ++rit;
    }
    cout << endl;
    PrintVector(v);
    return 0;
  }
}

2.3 vector 空间增长问题

函数	说明
size	获取数据个数
capacity	获取容器容量
empty	判断容器是否为空

resize	改变vector的size
reserve	预留空间

值得一提的是：

capacity的代码在vs和g++下分别运行会发现，vs下capacity是按1.5倍增长的，g++是按2倍增长的。这个问题经常会考察，不要固化的认为，顺序表增容都是2倍，具体增长多少是根据具体的需求定义的。vs是PJ版本STL，g++是SGI版本STL。
reserve只负责开辟空间，如果确定知道需要用多少空间，reserve可以缓解vector增容的代价缺陷问题。
resize在开空间的同时还会进行初始化，影响size。

2.4 vector 增删查改

用法举例：

push_back/pop_back

#include <iostream>
#include <vector>
using namespace std;
int main()
{
  int a[] = { 1, 2, 3, 4 };
  vector<int> v(a, a+sizeof(a)/sizeof(int));
  vector<int>::iterator it = v.begin();
  while (it != v.end()) 
  {
    cout << *it << " ";
    ++it;
  }
  cout << endl;
  v.pop_back();
  v.pop_back();
  it = v.begin();
  while (it != v.end()) 
  {
    cout << *it << " ";
    ++it;
  }
  cout << endl;
  return 0;
}

find / insert / erase

#include <iostream>
#include <algorithm>
#include <vector>
using namespace std;
int main()
{
  int a[] = { 1, 2, 3, 4 };
  vector<int> v(a, a + sizeof(a) / sizeof(int));
  // 使用find查找3所在位置的iterator
  vector<int>::iterator pos = find(v.begin(), v.end(), 3);
  // 在pos位置之前插入30
  v.insert(pos, 30);
  vector<int>::iterator it = v.begin();
  while (it != v.end()) 
  {
    cout << *it << " ";
    ++it;
  }
  cout << endl;
  pos = find(v.begin(), v.end(), 3);
  // 删除pos位置的数据
  v.erase(pos);
  it = v.begin();
  while (it != v.end()) 
  {
    cout << *it << " ";
    ++it;
  }
  cout << endl;
  return 0;
}

operator[]+index 和 C++11中vector的新式for+auto的遍历

#include <iostream>
#include <vector>
using namespace std;
int main()
{
  int a[] = { 1, 2, 3, 4 };
  vector<int> v(a, a + sizeof(a) / sizeof(int));
  // 通过[]读写第0个位置。
  v[0] = 10;
  cout << v[0] << endl;
  // 通过[i]的方式遍历vector
  for (size_t i = 0; i < v.size(); ++i)
    cout << v[i] << " ";
  cout << endl;
  vector<int> swapv;
  swapv.swap(v);
  cout << "v data:";
  for (size_t i = 0; i < v.size(); ++i)
    cout << v[i] << " ";
  cout << endl;
  cout << "swapv data:";
  for (size_t i = 0; i < swapv.size(); ++i)
    cout << swapv[i] << " ";
  cout << endl;
  // C++11支持的新式范围for遍历
  for(auto x : v)
    cout<< x << " ";
  cout<<endl;
  return 0;
}

二、vector 迭代器失效

迭代器的主要作用就是让算法能够不用关心底层数据结构，其底层实际就是一个指针，或者是对指针进行了封装，比如：vector的迭代器就是原生态指针T*。因此迭代器失效，实际就是迭代器底层对应指针所指向的空间被销毁了，而使用一块已经被释放的空间，造成的后果是程序崩溃(即如果继续使用已经失效的迭代器，程序可能会崩溃)。

对于vector可能会导致其迭代器失效的操作有：

1.会引起其底层空间改变的操作，都有可能是迭代器失效，比如：resize、reserve、insert、assign、ush_back等

例如：

#include <iostream>
using namespace std;
#include <vector>
int main()
{
  vector<int> v{1,2,3,4,5,6};
  auto it = v.begin();
  // 将有效元素个数增加到100个，多出的位置使用8填充，操作期间底层会扩容
  // v.resize(100, 8);
  // reserve的作用就是改变扩容大小但不改变有效元素个数，操作期间可能会引起底层容量改变
  // v.reserve(100);
  // 插入元素期间，可能会引起扩容，而导致原空间被释放
  // v.insert(v.begin(), 0);
  // v.push_back(8);
  // 给vector重新赋值，可能会引起底层容量改变
  v.assign(100, 8);
  /*
  出错原因：以上操作，都有可能会导致vector扩容，也就是说vector底层原理旧空间被释放掉，
  而在打印时，it还使用的是释放之间的旧空间，在对it迭代器操作时，实际操作的是一块已经被释放的
  空间，而引起代码运行时崩溃。
  解决方式：在以上操作完成之后，如果想要继续通过迭代器操作vector中的元素，只需给it重新
  赋值即可。
  */
  while(it != v.end())
  {
    cout<< *it << " " ;
    ++it;
  }
  cout<<endl;
  return 0;
}

指定位置元素的删除操作：erase
例如：

#include <iostream>
using namespace std;
#include <vector>
int main()
{
  int a[] = { 1, 2, 3, 4 };
  vector<int> v(a, a + sizeof(a) / sizeof(int));
  // 使用find查找3所在位置的iterator
  vector<int>::iterator pos = find(v.begin(), v.end(), 3);
  // 删除pos位置的数据，导致pos迭代器失效。
  v.erase(pos);
  cout << *pos << endl; // 此处会导致非法访问
  return 0;
}

erase删除pos位置元素后，pos位置之后的元素会往前搬移，没有导致底层空间的改变，理论上讲迭代器不应该会失效，但是：如果pos刚好是最后一个元素，删完之后pos刚好是end的位置，而end位置是没有元素的，那么pos就失效了。因此删除vector中任意位置上元素时，vs就认为该位置迭代器失效了。

迭代器失效解决办法：在使用前，对迭代器重新赋值即可。

三、vector深度剖析及模拟实现

1、实现代码

#pragma once
#include<iostream>
#include<assert.h>
using std::cout;
using std::endl;
namespace my_vector
{
  template<class T>
  class vector
  {
  public:
    typedef T* iterator;
    typedef const T* const_iterator;
    vector()
      :_start(nullptr)
      , _finish(nullptr)
      , _endofstoage(nullptr)
    {}
    template <class InputIterator>
    vector(InputIterator first, InputIterator last)
      : _start(nullptr)
      , _finish(nullptr)
      , _endofstoage(nullptr)
    {
      while (first != last)
      {
        push_back(*first);
        ++first;
      }
    }
    vector(size_t n, const T& val = T())
      : _start(nullptr)
      , _finish(nullptr)
      , _endofstoage(nullptr)
    {
      reserve(n);
      for (size_t i = 0; i < n; ++i)
      {
        push_back(val);
      }
    }
    vector(int n, const T& val = T())
      : _start(nullptr)
      , _finish(nullptr)
      , _endofstoage(nullptr)
    {
      reserve(n);
      for (int i = 0; i < n; ++i)
      {
        push_back(val);
      }
    }
    void swap(vector<T>& v)
    {
      std::swap(_start, v._start);
      std::swap(_finish, v._finish);
      std::swap(_endofstoage, v._endofstoage);
    }
    // 休息11：37继续
    //vector(const vector& v);
    vector(const vector<T>& v)
      : _start(nullptr)
      , _finish(nullptr)
      , _endofstoage(nullptr)
    {
      vector<T> tmp(v.begin(), v.end());
      swap(tmp);
    }
    //vector& operator=(vector v)
    vector<T>& operator=(vector<T> v)
    {
      swap(v);
      return *this;
    }
    // 资源管理
    ~vector()
    {
      if (_start)
      {
        delete[] _start;
        _start = _finish = _endofstoage = nullptr;
      }
    }
    iterator begin()
    {
      return _start;
    }
    iterator end()
    {
      return _finish;
    }
    const_iterator begin() const
    {
      return _start;
    }
    const_iterator end() const
    {
      return _finish;
    }
    size_t size() const
    {
      return _finish - _start;
    }
    size_t capacity() const
    {
      return _endofstoage - _start;
    }
    void reserve(size_t n)
    {
      size_t sz = size();
      if (n > capacity())
      {
        T* tmp = new T[n];
        if (_start)
        {
          memcpy(tmp, _start, size()*sizeof(T));
          delete[] _start;
        }
        _start = tmp;
      }
      _finish = _start + sz;
      _endofstoage = _start + n;
    }
    //void resize(size_t n, const T& val = T())
    void resize(size_t n, T val = T())
    {
      if (n > capacity())
      {
        reserve(n);
      }
      if (n > size())
      {
        while (_finish < _start + n)
        {
          *_finish = val;
          ++_finish;
        }
      }
      else
      {
        _finish = _start + n;
      }
    }
    void push_back(const T& x)
    {
      /*if (_finish == _endofstoage)
      {
        size_t newCapacity = capacity() == 0 ? 4 : capacity() * 2;
        reserve(newCapacity);
      }
      *_finish = x;
      ++_finish;*/
      insert(end(), x);
    }
    void pop_back()
    {
      /*if (_finish > _start)
      {
        --_finish;
      }*/
      erase(end() - 1);
    }
    T& operator[](size_t pos)
    {
      assert(pos < size());
      return _start[pos];
    }
    const T& operator[](size_t pos) const
    {
      assert(pos < size());
      return _start[pos];
    }
    iterator insert(iterator pos, const T& x)
    {
      // 检查参数
      assert(pos >= _start && pos <= _finish);
      // 扩容
      // 扩容以后pos就失效了,需要更新一下
      if (_finish == _endofstoage)
      {
        size_t n = pos - _start;
        size_t newCapacity = capacity() == 0 ? 4 : capacity() * 2;
        reserve(newCapacity);
        pos = _start + n;
      }
      // 挪动数据
      iterator end = _finish - 1;
      while (end >= pos)
      {
        *(end + 1) = *end;
        --end;
      }
      *pos = x;
      ++_finish;
      return pos;
    }
    iterator erase(iterator pos)
    {
      assert(pos >= _start && pos < _finish);
      iterator it = pos + 1;
      while (it != _finish)
      {
        *(it - 1) = *it;
        ++it;
      }
      --_finish;
      return pos;
    }
    void clear()
    {
      _finish = _start;
    }
  private:
    iterator _start;
    iterator _finish;
    iterator _endofstoage;
  };
}

2、使用memcpy拷贝问题

假设模拟实现的vector中的reserve接口中，使用memcpy进行的拷贝，以下代码会发生什么问题？

int main()
{
  my_vector::vector<my_vector::string> v;
  v.push_back("1111");
  v.push_back("2222");
  v.push_back("3333");
  return 0;
}

问题分析：

memcpy是内存的二进制格式拷贝，将一段内存空间中内容原封不动的拷贝到另外一段内存空间中
如果拷贝的是自定义类型的元素，memcpy即高效又不会出错，但如果拷贝的是自定义类型元素，并且自定义类型元素中涉及到资源管理时，就会出错，因为memcpy的拷贝实际是浅拷贝。

结论：如果对象中涉及到资源管理时，千万不能使用memcpy进行对象之间的拷贝，因为memcpy是浅拷贝，否则可能会引起内存泄漏甚至程序崩溃。

3、使用模拟实现的vector实现杨辉三角中的深层次拷贝问题

3.1 vector的深层次拷贝问题

构造一个杨辉三角，打印一下并返回构造完成后的杨辉三角：

class Solution {
public:
  vector<vector<int>> generate(int numRows) {
    vector<vector<int>> vv;
    vv.resize(numRows);
    for (size_t i = 0; i < vv.size(); ++i)
    {
      // 杨辉三角，每行个数依次递增
      vv[i].resize(i + 1, 0);
      // 第一个和最后一个初始化成1
      vv[i][0] = 1;
      vv[i][vv[i].size() - 1] = 1;
    }
    for (size_t i = 0; i < vv.size(); ++i)
    {
      for (size_t j = 0; j < vv[i].size(); ++j)
      {
        if (vv[i][j] == 0)
        {
          // 中间位置等于上一行j-1 和 j个相加
          vv[i][j] = vv[i - 1][j - 1] + vv[i - 1][j];
        }
      }
    }
    for (size_t i = 0; i < vv.size(); ++i)
    {
      for (size_t j = 0; j < vv[i].size(); ++j)
      {
        cout << vv[i][j] << " ";
      }
      cout << endl;
    }
    cout << endl;
    return vv;
  }
};

接收构造完成后的杨辉三角并打印：

void test()
{
  vector<vector<int>> ret = Solution().generate(5);
  for (size_t i = 0; i < ret.size(); ++i)
  {
    for (size_t j = 0; j < ret[i].size(); ++j)
    {
      cout << ret[i][j] << " ";
    }
    cout << endl;
  }
  cout << endl;
}

结果：程序崩溃

调试可知：利用memcpy扩容，造成扩容前和扩容后杨辉三角的前四排的元素指向同一地址，发生的浅拷贝，当delete_start的时候导致tmp也被释放了。想要解决这个问题就必须使用深拷贝的方法去替代memcpy即可。

3.2 解决方法——更新reserve函数

使用深拷贝的方法去替代memcpy：

    void reserve(size_t n)
    {
      size_t sz = size();
      if (n > capacity())
      {
        T* tmp = new T[n];
        if (_start)
        {
          //memcpy(tmp, _start, size()*sizeof(T));
          for (size_t i = 0; i < size(); ++i)
          {
            tmp[i] = _start[i];
          }
          delete[] _start;
        }
        _start = tmp;
      }
      _finish = _start + sz;
      _endofstoage = _start + n;
    }

此时，问题便得到了完美的解决。

STL中vector的用法以及模拟实现

一、vector的介绍及使用

1、vector的介绍

2、vector的使用

2.1 vector的定义

2.2 vector iterator 的使用

2.3 vector 空间增长问题

2.4 vector 增删查改

二、vector 迭代器失效

三、vector深度剖析及模拟实现

1、实现代码

2、使用memcpy拷贝问题

3、使用模拟实现的vector实现杨辉三角中的深层次拷贝问题

3.1 vector的深层次拷贝问题

3.2 解决方法——更新reserve函数

热门文章

最新文章

相关课程

相关电子书

热门

活动广场

任务中心

开发者评测

高校计划

乘风者计划

训练营

阿里云MVP

话题

直播

下载

镜像站

技术资料

插件

STL中vector的用法以及模拟实现

一、vector的介绍及使用

1、vector的介绍

2、vector的使用

2.1 vector的定义

2.2 vector iterator 的使用

2.3 vector 空间增长问题

2.4 vector 增删查改

二、vector 迭代器失效

三、vector深度剖析及模拟实现

1、实现代码

2、使用memcpy拷贝问题

3、使用模拟实现的vector实现杨辉三角中的深层次拷贝问题

3.1 vector的深层次拷贝问题

3.2 解决方法——更新reserve函数

热门文章

最新文章

相关课程

相关电子书