基本框架
在模拟实现vector之前我们应该对vector有个基本的框架,可以通过对源代码的分析与了解,实现自己的vector。
第一步:现有大致的类模板,类中的成员变量
第二步:构造函数、析构函数、赋值运算符重载函数、拷贝构造函数这些默认函数
第三步:关注push_back(),reserve(),insert()等接口函数
模拟实现vector
namespace my_vector { template<class T> class vector { public: typedef T* iterator; private: iterator _start; iterator _finish; iterator _end_of_storage; }; }
设置好一个命名空间,类,以及成员变量。
vector() :_start(nullptr) ,_finish(nullptr) ,_end_of_sorage(nullptr) {}
设置一个构造函数,可以选择在初始化变量进行初始化成员变量。
~vector() { if (_start) { delete[] _start; _start = _finish = _end_of_storage = nullptr; } }
设置一个析构函数,注意这里需要对_start进行判空,如果_start为空,则说明_start是是一空指针,则无法进行析构。
size_t size() const { return _finish - _start; }
设置一个size()函数,用来计算vector的数据个数。
size_t capacity() const { return _end_of_storage - _start; }
设置一个capacity()函数,用来计算vector的容量大小。
void reserve(size_t n) { if (capacity() < n) { size_t sz = size(); T* tmp = new T[n]; if (_start) { //memcpy(tmp, _start, sizeof(T) * sz); for (size_t i = 0; i < sz; ++i) { tmp[i] = _start[i]; } delete[] _start; } _start = tmp; _finish = _start + sz; _end_of_storage = _start + n; } }
设置一个reserve()函数,可以用来提高容量。这里需要注意的是需要提前知道_start与_finish之间的元素个数,以便设置_finish。
void push_back(const T& x) { if (_finish == _end_of_storage) { size_t newcapacity = (capacity() == 0 ? 4 : capacity() * 2); reserve(newcapacity); } *_finish = x; ++_finish; }
设置一个push_back()函数,可以用来后增数据。
typedef T* iterator; typedef const T* const_iterator; iterator begin() { return _start; } iterator end() { return _finish; } const_iterator begin() const { return _start; } const_iterator end() const { return _finish; }
设置迭代器函数,包括begin()和end(),注意需要存在权限的问题。
T& operator[](size_t pos) { assert(pos < size()); return _start[pos]; } const T& operator[](size_t pos) const { assert(pos < size()); return _start[pos]; }
设置一个下标+[ ]函数,用于寻找在某个位置的元素。
iterator insert(iterator pos, const T& x) { assert(pos >= _start && pos <= _finish); if (_finish == _end_of_storage) { size_t len = pos - _start; size_t newcapacity = (capacity() == 0 ? 4 : capacity() * 2); reserve(newcapacity); pos = _start + len; } iterator end = _finish - 1; while (end >= pos) { *(end + 1) = *end; end--; } *pos = x; ++_finish; return pos; }
设置一个insert()迭代器,用来插入数据。注意,这里在扩容时会出现迭代器失效的问题,需要注意的是,在使用insert()的函数的时候,以后就不能使用形参迭代器,可能会失效。
iterator erase(iterator pos) { assert(pos >= _start && pos < _finish); iterator it = pos + 1; while(it != _finish) { *(it - 1) = *it; it++; } _finish--; return pos; }
设置一个erase()函数,用于删除指定位置的元素。
- 迭代器的主要作用就是让算法能够不用关心底层数据结构,其底层本质上就是一个指针,或者是对指针进行了封装。比如:vector的迭代器就是原生态指针T* 。
因此迭代器失效,实际上就是迭代器底层对应指针所指向的空间被销毁了,而此时使用了一块以及被释放了的空间,造成的后果就是程序崩溃(即继续使用已经失效的迭代器,程序可能会崩溃)。
对于vector可能会导致其迭代器失效的操作有:
1.会引起其底层空间改变的操作,都有可能是迭代器失效,比如:resize,reserve,insert,assign,push_back。当vector扩容时,其底层原理旧空间就会被释放掉,而在使用之前的迭代器时,还是使用的之前未释放前的就空间,所以在对旧迭代器操作时,实际操作的是一块已经被释放的空间,而引起代码运行时崩溃。
【解决办法】:在以上操作完成之后,如果想要继续通过迭代器操作vector中的元素,需要对迭代器重新赋值。
2.指定位置元素的删除操作erase().
erase删除pos位置元素后,pos位置之后的元素会往前移,没有导致底层空间的改变,理论上来讲迭代器是不会失效的。但是,如果pos位置刚好是最后一个元素,删除之后pos刚好是end的位置,而end位置是,没有元素的,那么pos就会失效。因此删除vector中的任意位置上的元素时,vs就会认为该位置迭代器失效。
3.注意:在Linux环境下,gcc编译器对迭代器的检测并不是非常严格,并没有vs下极端。
上述三个例子总结:SGI STL中,迭代器失效后,代码并不一定会崩溃,但是运行结果肯定不对,如果it不在begin和end范围之内,肯定会崩溃的。
4.与vector类似,string在插入+扩容操作+erase之后,迭代器也会失效。
- 迭代器失效的解决办法:在使用前,对迭代器重新赋值。
void pop_back() { erase(_finish - 1); }
设置一个pop_back()函数,用于尾删数据。
void resize(size_t n, const T& val = T()) { if (n < size()) { _finish = _start + n; } else { reserve(n); while (_finish != _start + n) { *_finish = val; ++_finish; } } }
设置一个resize()函数,可以用来添加单一数据并开辟空间。
void swap(vector<T>& v) { std::swap(_start, v._start); std::swap(_finish, v._finish); std::swap(_end_of_storage, v._end_of_storage); } vector<T>& operator=(vector<T> v) { swap(v); return *this; }
设置一个赋值运算符重载函数,用于赋值构造。
vector(const vector<T>& v) { _start = new T[v.capacity()]; for (size_t i = 0; i < v.size(); ++i) { _start[i] = v._start[i]; } _finish = _start + v.size(); _end_of_storage = _start + v.capacity(); }
设置一个拷贝构造函数。
注意,这里使用for循环,而并没有使用memcpy的原因是:
1.memcpy是内存的二进制格式拷贝,将一段内存空间中的内容原封不动的拷贝到另外一个内存空间里。
2.如果拷贝的是内置类型的元素,memcpy即高效又不会出错,但是如果拷贝的是自定义类型元素,并且自定义类型元素中涉及到资源管理时,就会出错,因为memcpy的拷贝实际是浅拷贝。
结论:如果对象中涉及到资源管理时,千万不能使用memcpy进行对象之间的拷贝,因为memcpy是浅拷贝,否则可能会引起内存泄漏甚至程序崩溃。
动态二维数组的理解
构造一个vv动态二维数组,vv中总共有n个元素,每个元素都是vector类型的,每行没有包含任何元素,如果n为5时:
vv中元素填充完成之后:
使用标准库中vector构建动态二维数组时与上图实际上是一致的。
vector的代码展示
#pragma once #include<iostream> #include<assert.h> namespace my_vector { template<class T> class vector { public: typedef T* iterator; typedef const T* const_iterator; iterator begin() { return _start; } iterator end() { return _finish; } const_iterator begin() const { return _start; } const_iterator end() const { return _finish; } vector() :_start(nullptr) , _finish(nullptr) , _end_of_storage(nullptr) {} ~vector() { if (_start) { delete[] _start; _start = _finish = _end_of_storage = nullptr; } } size_t size() const { return _finish - _start; } size_t capacity() const { return _end_of_storage - _start; } void push_back(const T& x) { if (_finish == _end_of_storage) { size_t newcapacity = (capacity() == 0 ? 4 : capacity() * 2); reserve(newcapacity); } *_finish = x; ++_finish; } iterator insert(iterator pos, const T& x) { assert(pos >= _start && pos <= _finish); if (_finish == _end_of_storage) { size_t len = pos - _start; size_t newcapacity = (capacity() == 0 ? 4 : capacity() * 2); reserve(newcapacity); pos = _start + len; } iterator end = _finish - 1; while (end >= pos) { *(end + 1) = *end; end--; } *pos = x; ++_finish; return pos; } void reserve(size_t n) { if (capacity() < n) { size_t sz = size(); T* tmp = new T[n]; if (_start) { //memcpy(tmp, _start, sizeof(T) * sz); for (size_t i = 0; i < sz; ++i) { tmp[i] = _start[i]; } delete[] _start; } _start = tmp; _finish = _start + sz; _end_of_storage = _start + n; } } T& operator[](size_t pos) { assert(pos < size()); return _start[pos]; } const T& operator[](size_t pos) const { assert(pos < size()); return _start[pos]; } iterator erase(iterator pos) { assert(pos >= _start && pos < _finish); iterator it = pos + 1; while(it != _finish) { *(it - 1) = *it; it++; } _finish--; return pos; } void pop_back() { erase(_finish - 1); } void resize(size_t n, const T& val = T()) { if (n < size()) { _finish = _start + n; } else { reserve(n); while (_finish != _start + n) { *_finish = val; ++_finish; } } } vector(const vector<T>& v) { _start = new T[v.capacity()]; for (size_t i = 0; i < v.size(); ++i) { _start[i] = v._start[i]; } _finish = _start + v.size(); _end_of_storage = _start + v.capacity(); } void swap(vector<T>& v) { std::swap(_start, v._start); std::swap(_finish, v._finish); std::swap(_end_of_storage, v._end_of_storage); } vector<T>& operator=(vector<T> v) { swap(v); return *this; } private: iterator _start; iterator _finish; iterator _end_of_storage; }; }