当扩容之后我们发现,vector的成员变量地址都变了,但是pos指向的还是原来的位置,导致pos指向的内容也就变成了我们上面看到的随机值。
这就是扩容需要重新开辟一块空间并且释放掉原来的空间导致的迭代器失效问题。
我们传过来的参数pos是没有重新分配空间的地址,那么在扩容时失效应该如何避免呢?
这里只需要记录原来pos与_start的距离,然后重新让pos指向有效位置即可。
iterator insert(iterator pos, const T& x) { assert(pos <= _finish); assert(pos > _start); if (_finish == _endOfStorage) { int n = pos - _start; int sum = capacity() == 0 ? 4 : 2 * capacity(); reserve(sum); pos = _start + n; } iterator p1 = _finish; while (p1 > pos) { *p1 = *(p1 - 1); p1--; } *pos = x; ++_finish; return pos; }
迭代器失效归根结底就是野指针的问题。
那么再来看这一段代码:
int main() { vector<int>arr; arr.push_back(1); arr.push_back(2); arr.push_back(3); arr.push_back(4); for (auto e : arr) { cout << e; } cout << endl; vector<int>::iterator p = find(arr.begin(), arr.end(), 3); if (p != arr.end()) arr.insert(p, 5);//这里会发生扩容 p++;//这里再次对于p进行改动会怎么样? return 0; }
这里也是野指针的问题,所以这里记得利用返回值。
int main() { vector<int>arr; arr.push_back(1); arr.push_back(2); arr.push_back(3); arr.push_back(4); for (auto e : arr) { cout << e; } cout << endl; vector<int>::iterator p = find(arr.begin(), arr.end(), 3); if (p != arr.end()) p = arr.insert(p, 5); for (auto e : arr) { cout << e; } cout << endl; (*p)++;//这里再次对于p进行改动会怎么样? for (auto e : arr) { cout << e; } cout << endl; return 0; }
至于为什么insert这个接口的函数pos参数为什么不是引用,这是因为如果是引用就要考虑传值时候的权限放大与缩小的问题了。
现在来看看第二种迭代器失效的问题:
在实现erase接口的时候代码是这样写的:
iterator erase(iterator pos) { assert(pos >= _start); assert(pos < _finish); iterator p = pos + 1; while (p < _finish) { *(p - 1) = *p; p++; } _finish--; return pos; }
测试了一下没什么问题:
那么如果这样呢(这里先用库里面的vector来测试)
int main() { vector<int>arr; arr.push_back(1); arr.push_back(2); arr.push_back(3); arr.push_back(4); for (auto e : arr) { cout << e; } cout << endl; vector<int>::iterator p = find(arr.begin(), arr.end(), 3); arr.erase(p); for (auto e : arr) { cout << e; } cout << endl; p++; return 0; }
那么这里也是野指针的问题。
这是为什么呢?我们的这个对象并没有重新分配地址啊。
在g++下这里是并没有报错的,而VS这里报错说明底层的实现原理是不同的。
这里失效时更好一点的,如果是尾删的话就是失效了。
所以按照库里面来返回删除元素的下一个元素的位置就好了。
深层深浅拷贝问题
注意我的操作:
int main() { baiye::vector<baiye::vector<int>>arr; baiye::vector<int>cpp(10, 1); arr.push_back(cpp); arr.push_back(cpp); arr.push_back(cpp); arr.push_back(cpp); for (int i = 0; i < arr.size(); i++) { for (int j = 0; j < cpp.size(); j++) { cout << arr[i][j] << ' '; } cout << endl; } return 0; }
OK,暂时没问题,再尾插一个cpp呢?
没让你失望,他崩了。
为什么4个不崩5个崩呢?
因为这也和重新开辟空间有关,我们来调试看看:
我直接快进到第五次尾插cpp
这里看好他们的地址:
这里地址p的成员地址和this指针中的成员地址相同了,这是为何?
图解:
这里是压入前四个的cpp的状态,此时并没有发生扩容。
当压入第五个cpp的时候发生扩容,我们看到代码是运行到memcpy的地方出问题的。
我们都知道memcpy拷贝是一个字节一个字节进行拷贝的,这里拷贝的是对标类型为vector<int>类型的_start进行开辟空间的p,那么拷贝的就是_start和p所指向位置的所有内容。
但是他们的成员都是指针,拷贝的都是地址编号,这就导致了新开辟的空间的前四个内容的成员指针指向了旧空间的成员指向的内容。
那么,下一步就是释放掉原来的旧空间了,释放的位置是_start指向的位置,这也就导致p空间中的前四个类型指向的空间也同样被释放掉了。
这就是整个问题的所在之处,解决问题方法就是不让他一个字节一个字节拷贝,可以用赋值来避免自定义类型的这种情况,如下:
void reserve(size_t n) { if (n > capacity()) { T* p = new T[n]; int a = size(); if (_start) { for (int i = 0; i < a; i++) { p[i] = _start[i];//这里改成赋值,就是调用拷贝构造去了 } delete[] _start; } _start = p; _finish = _start + a; _endOfStorage = _start + n; } }