【C++】vector的模拟实现

简介: 【C++】vector的模拟实现

基本框架

在模拟实现vector之前我们应该对vector有个基本的框架,可以通过对源代码的分析与了解,实现自己的vector。

第一步:现有大致的类模板,类中的成员变量

第二步:构造函数、析构函数、赋值运算符重载函数、拷贝构造函数这些默认函数

第三步:关注push_back(),reserve(),insert()等接口函数

模拟实现vector

namespace my_vector
{
  template<class T>
  class vector
  {
  public:
    typedef T* iterator;
 
  private:
    iterator _start;
    iterator _finish;
    iterator _end_of_storage;
  };
}

设置好一个命名空间,类,以及成员变量

    vector()
      :_start(nullptr)
      ,_finish(nullptr)
      ,_end_of_sorage(nullptr)
    {}

设置一个构造函数,可以选择在初始化变量进行初始化成员变量。

    ~vector()
    {
      if (_start)
      {
        delete[] _start;
        _start = _finish = _end_of_storage = nullptr;
      }
    }

设置一个析构函数,注意这里需要对_start进行判空,如果_start为空,则说明_start是是一空指针,则无法进行析构。

    size_t size() const
    {
      return _finish - _start;
    }

设置一个size()函数,用来计算vector的数据个数。

    size_t capacity() const
    {
      return _end_of_storage - _start;
    }

设置一个capacity()函数,用来计算vector的容量大小。

void reserve(size_t n)
{
  if (capacity() < n)
  {
    size_t sz = size();
    T* tmp = new T[n];
    if (_start)
    {
      //memcpy(tmp, _start, sizeof(T) * sz);
      for (size_t i = 0; i < sz; ++i)
      {
        tmp[i] = _start[i];
      }
      delete[] _start;
    }
    _start = tmp;
    _finish = _start + sz;
    _end_of_storage = _start + n;
  }
}

设置一个reserve()函数,可以用来提高容量。这里需要注意的是需要提前知道_start与_finish之间的元素个数,以便设置_finish。

    void push_back(const T& x)
    {
      if (_finish == _end_of_storage)
      {
        size_t newcapacity = (capacity() == 0 ? 4 : capacity() * 2);
        reserve(newcapacity);
      }
      *_finish = x;
      ++_finish;
    }

设置一个push_back()函数,可以用来后增数据。

        typedef T* iterator;
    typedef const T* const_iterator;
 
    iterator begin()
    {
      return _start;
    }
    iterator end()
    {
      return _finish;
    }
    const_iterator begin() const
    {
      return _start;
    }
    const_iterator end() const
    {
      return _finish;
    }

设置迭代器函数,包括begin()和end(),注意需要存在权限的问题。

    T& operator[](size_t pos)
    {
      assert(pos < size());
 
      return _start[pos];
    }
    const T& operator[](size_t pos) const
    {
      assert(pos < size());
 
      return _start[pos];
    }

设置一个下标+[ ]函数,用于寻找在某个位置的元素。

    iterator insert(iterator pos, const T& x)
    {
      assert(pos >= _start && pos <= _finish);
      if (_finish == _end_of_storage)
      {
        size_t len = pos - _start;
        size_t newcapacity = (capacity() == 0 ? 4 : capacity() * 2);
        reserve(newcapacity);
        pos = _start + len;
      }
      iterator end = _finish - 1;
      while (end >= pos)
      {
        *(end + 1) = *end;
        end--;
      }
      *pos = x;
      ++_finish;
 
      return pos;
    }

设置一个insert()迭代器,用来插入数据。注意,这里在扩容时会出现迭代器失效的问题,需要注意的是,在使用insert()的函数的时候,以后就不能使用形参迭代器,可能会失效。

    iterator erase(iterator pos)
    {
      assert(pos >= _start && pos < _finish);
 
      iterator it = pos + 1;
      while(it != _finish)
      {
        *(it - 1) = *it;
        it++;
      }
      _finish--;
      return pos;
    }

设置一个erase()函数,用于删除指定位置的元素。

  • 迭代器的主要作用就是让算法能够不用关心底层数据结构,其底层本质上就是一个指针,或者是对指针进行了封装。比如:vector的迭代器就是原生态指针T* 。

因此迭代器失效,实际上就是迭代器底层对应指针所指向的空间被销毁了,而此时使用了一块以及被释放了的空间,造成的后果就是程序崩溃(即继续使用已经失效的迭代器,程序可能会崩溃)。

对于vector可能会导致其迭代器失效的操作有:

1.会引起其底层空间改变的操作,都有可能是迭代器失效,比如:resize,reserve,insert,assign,push_back。当vector扩容时,其底层原理旧空间就会被释放掉,而在使用之前的迭代器时,还是使用的之前未释放前的就空间,所以在对旧迭代器操作时,实际操作的是一块已经被释放的空间,而引起代码运行时崩溃。

【解决办法】:在以上操作完成之后,如果想要继续通过迭代器操作vector中的元素,需要对迭代器重新赋值。

2.指定位置元素的删除操作erase().

erase删除pos位置元素后,pos位置之后的元素会往前移,没有导致底层空间的改变,理论上来讲迭代器是不会失效的。但是,如果pos位置刚好是最后一个元素,删除之后pos刚好是end的位置,而end位置是,没有元素的,那么pos就会失效。因此删除vector中的任意位置上的元素时,vs就会认为该位置迭代器失效。

3.注意:在Linux环境下,gcc编译器对迭代器的检测并不是非常严格,并没有vs下极端。

上述三个例子总结:SGI STL中,迭代器失效后,代码并不一定会崩溃,但是运行结果肯定不对,如果it不在begin和end范围之内,肯定会崩溃的。

4.与vector类似,string在插入+扩容操作+erase之后,迭代器也会失效。

- 迭代器失效的解决办法:在使用前,对迭代器重新赋值。

    void pop_back()
    {
      erase(_finish - 1);
    }

设置一个pop_back()函数,用于尾删数据。

    void resize(size_t n, const T& val = T())
    {
      if (n < size())
      {
        _finish = _start + n;
      }
      else
      {
        reserve(n);
        while (_finish != _start + n)
        {
          *_finish = val;
          ++_finish;
        }
      }
    }

设置一个resize()函数,可以用来添加单一数据并开辟空间。

    void swap(vector<T>& v)
    {
      std::swap(_start, v._start);
      std::swap(_finish, v._finish);
      std::swap(_end_of_storage, v._end_of_storage);
    }
    vector<T>& operator=(vector<T> v)
    {
      swap(v);
 
      return *this;
    }

设置一个赋值运算符重载函数,用于赋值构造。

vector(const vector<T>& v)
{
  _start = new T[v.capacity()];
  for (size_t i = 0; i < v.size(); ++i)
  {
    _start[i] = v._start[i];
  }
  _finish = _start + v.size();
  _end_of_storage = _start + v.capacity();
}

设置一个拷贝构造函数。

注意,这里使用for循环,而并没有使用memcpy的原因是:

1.memcpy是内存的二进制格式拷贝,将一段内存空间中的内容原封不动的拷贝到另外一个内存空间里。

2.如果拷贝的是内置类型的元素,memcpy即高效又不会出错,但是如果拷贝的是自定义类型元素,并且自定义类型元素中涉及到资源管理时,就会出错,因为memcpy的拷贝实际是浅拷贝。

结论:如果对象中涉及到资源管理时,千万不能使用memcpy进行对象之间的拷贝,因为memcpy是浅拷贝,否则可能会引起内存泄漏甚至程序崩溃。

动态二维数组的理解

构造一个vv动态二维数组,vv中总共有n个元素,每个元素都是vector类型的,每行没有包含任何元素,如果n为5时:

vv中元素填充完成之后:

使用标准库中vector构建动态二维数组时与上图实际上是一致的。

vector的代码展示

#pragma once
#include<iostream>
#include<assert.h>
 
namespace my_vector
{
  template<class T>
  class vector
  {
  public:
    typedef T* iterator;
    typedef const T* const_iterator;
 
    iterator begin()
    {
      return _start;
    }
    iterator end()
    {
      return _finish;
    }
    const_iterator begin() const
    {
      return _start;
    }
    const_iterator end() const
    {
      return _finish;
    }
    vector()
      :_start(nullptr)
      , _finish(nullptr)
      , _end_of_storage(nullptr)
    {}
    ~vector()
    {
      if (_start)
      {
        delete[] _start;
        _start = _finish = _end_of_storage = nullptr;
      }
    }
    size_t size() const
    {
      return _finish - _start;
    }
    size_t capacity() const
    {
      return _end_of_storage - _start;
    }
    void push_back(const T& x)
    {
      if (_finish == _end_of_storage)
      {
        size_t newcapacity = (capacity() == 0 ? 4 : capacity() * 2);
        reserve(newcapacity);
      }
      *_finish = x;
      ++_finish;
    }
    iterator insert(iterator pos, const T& x)
    {
      assert(pos >= _start && pos <= _finish);
      if (_finish == _end_of_storage)
      {
        size_t len = pos - _start;
        size_t newcapacity = (capacity() == 0 ? 4 : capacity() * 2);
        reserve(newcapacity);
        pos = _start + len;
      }
      iterator end = _finish - 1;
      while (end >= pos)
      {
        *(end + 1) = *end;
        end--;
      }
      *pos = x;
      ++_finish;
 
      return pos;
    }
    void reserve(size_t n)
    {
      if (capacity() < n)
      {
        size_t sz = size();
        T* tmp = new T[n];
        if (_start)
        {
          //memcpy(tmp, _start, sizeof(T) * sz);
          for (size_t i = 0; i < sz; ++i)
          {
            tmp[i] = _start[i];
          }
          delete[] _start;
        }
        _start = tmp;
        _finish = _start + sz;
        _end_of_storage = _start + n;
      }
    }
    T& operator[](size_t pos)
    {
      assert(pos < size());
 
      return _start[pos];
    }
    const T& operator[](size_t pos) const
    {
      assert(pos < size());
 
      return _start[pos];
    }
    iterator erase(iterator pos)
    {
      assert(pos >= _start && pos < _finish);
 
      iterator it = pos + 1;
      while(it != _finish)
      {
        *(it - 1) = *it;
        it++;
      }
      _finish--;
      return pos;
    }
    void pop_back()
    {
      erase(_finish - 1);
    }
    void resize(size_t n, const T& val = T())
    {
      if (n < size())
      {
        _finish = _start + n;
      }
      else
      {
        reserve(n);
        while (_finish != _start + n)
        {
          *_finish = val;
          ++_finish;
        }
      }
    }
    vector(const vector<T>& v)
    {
      _start = new T[v.capacity()];
      for (size_t i = 0; i < v.size(); ++i)
      {
        _start[i] = v._start[i];
      }
      _finish = _start + v.size();
      _end_of_storage = _start + v.capacity();
    }
    void swap(vector<T>& v)
    {
      std::swap(_start, v._start);
      std::swap(_finish, v._finish);
      std::swap(_end_of_storage, v._end_of_storage);
    }
    vector<T>& operator=(vector<T> v)
    {
      swap(v);
 
      return *this;
    }
  private:
    iterator _start;
    iterator _finish;
    iterator _end_of_storage;
  
  };
}


相关文章
|
5月前
|
存储 编译器 C++
【C++】vector介绍+模拟实现
【C++】vector介绍+模拟实现
|
2月前
|
存储 编译器 C语言
【c++丨STL】vector的使用
本文介绍了C++ STL中的`vector`容器,包括其基本概念、主要接口及其使用方法。`vector`是一种动态数组,能够根据需要自动调整大小,提供了丰富的操作接口,如增删查改等。文章详细解释了`vector`的构造函数、赋值运算符、容量接口、迭代器接口、元素访问接口以及一些常用的增删操作函数。最后,还展示了如何使用`vector`创建字符串数组,体现了`vector`在实际编程中的灵活性和实用性。
66 4
|
17天前
|
存储 对象存储 C++
C++ 中 std::array<int, array_size> 与 std::vector<int> 的深入对比
本文深入对比了 C++ 标准库中的 `std::array` 和 `std::vector`,从内存管理、性能、功能特性、使用场景等方面详细分析了两者的差异。`std::array` 适合固定大小的数据和高性能需求,而 `std::vector` 则提供了动态调整大小的灵活性,适用于数据量不确定或需要频繁操作的场景。选择合适的容器可以提高代码的效率和可靠性。
39 0
|
21天前
|
存储 编译器 C语言
【c++丨STL】vector模拟实现
本文深入探讨了 `vector` 的底层实现原理,并尝试模拟实现其结构及常用接口。首先介绍了 `vector` 的底层是动态顺序表,使用三个迭代器(指针)来维护数组,分别为 `start`、`finish` 和 `end_of_storage`。接着详细讲解了如何实现 `vector` 的各种构造函数、析构函数、容量接口、迭代器接口、插入和删除操作等。最后提供了完整的模拟实现代码,帮助读者更好地理解和掌握 `vector` 的实现细节。
30 0
|
3月前
|
存储 C++ 索引
【C++打怪之路Lv9】-- vector
【C++打怪之路Lv9】-- vector
27 1
|
3月前
|
安全 测试技术 C++
【C++篇】从零实现 C++ Vector:深度剖析 STL 的核心机制与优化2
【C++篇】从零实现 C++ Vector:深度剖析 STL 的核心机制与优化
78 6
|
3月前
|
安全 测试技术 C++
【C++篇】从零实现 C++ Vector:深度剖析 STL 的核心机制与优化1
【C++篇】从零实现 C++ Vector:深度剖析 STL 的核心机制与优化
96 7
|
3月前
|
编译器 C++
【C++】—— vector模拟实现
【C++】—— vector模拟实现
|
3月前
|
编译器 C语言 C++
【C++篇】解密 STL 动态之魂:全面掌握 C++ vector 的高效与优雅
【C++篇】解密 STL 动态之魂:全面掌握 C++ vector 的高效与优雅
62 3
|
3月前
|
C++
【C++】C++ STL探索:Vector使用与背后底层逻辑(三)
【C++】C++ STL探索:Vector使用与背后底层逻辑