从C语言到C++_15(vector的模拟实现)+迭代器失效问题(中)

简介: 从C语言到C++_15(vector的模拟实现)+迭代器失效问题

从C语言到C++_15(vector的模拟实现)+迭代器失效问题(上):https://developer.aliyun.com/article/1521287

3. vector的其它接口函数

3.1 修改后的reserve

我们刚才实现了 reserve,reserve 搬元素的时候也是 memcpy去进行拷贝的,又让 push_back 复用了 reserve, 其实这里存在一个非常严重的问题!

现在给出一个测试用例:

  void Test3()
  {
    vector<string> v;      // 在vector里放string
    v.push_back("1");
    v.push_back("2");
    v.push_back("3");
    v.push_back("4");
    v.push_back("5");
    v.push_back("6");
    v.push_back("7");
    v.push_back("8");
    v.push_back("9");
 
    for (const auto& e : v)
    {
      cout << e << " ";
    }
    cout << endl;
  }

这里发现程序崩掉了。

为什么会这样?原因在于我们在扩容和深拷贝时,用了一个 memcpy!

push_back 调用 reserve 扩容时就会出问题,根本原因是 memcpy 是浅拷贝。


问题分析:


memcpy 是内存的二进制格式拷贝,


将一段内存空间中内容原封不动的拷贝到另外一段内存空间中。


如果拷贝的是自定义类型的元素,memcpy 既高效又不会出错,


但如果拷贝的是自定义类型元素,并且自定义类型元素中涉及到资源管理时,


就会出错,因为memcpy的拷贝实际是浅拷贝。


(这里新的三个指针还是指向原来的空间,然后原来的空间又被释放了)


所以:如果对象中涉及到资源管理时,不能使用 memcpy 进行对象之间的拷贝,我们手动去拷:


修改后的 reserve:

    void reserve(size_t n)
    {
      if (n > capacity())
      {
        size_t sz = size();
        T* tmp = new T[n];
        if(_start)
        {
          //memcpy(tmp, _start, sizeof(T) * sz); 浅拷贝,不行
 
          for (size_t i = 0; i < sz; i++)// 如果T是int,一个一个拷贝没问题
          {
            tmp[i] = _start[i];// 如果T是string等自定义问题,一个一个拷贝调用的是T的深拷贝,也不会出问题。
          }
          delete[] _start;
        }
        _start = tmp;
        _finish = tmp + sz;
        _end_of_storage = tmp + n;
      }
    }

成功运行:

3.2 resize

vector 的 resize 如果不给第二个参数,默认给的是其对应类型的缺省值作为 "填充值"。

由于这里我们不知道具体类型是什么,这里缺省值我们使用匿名对象 T() ,

此外因为匿名对象的生命周期仅在当前一行,这里必须要用 const 引用匿名对象,

可以理解为延长其生命周期:

    void resize(size_t n, const T& val = T())
    {
      if (n > capacity())
      {
        reserve(n);
      }
      if (n > size())
      {
        while (_finish != _start + n)
        {
          *_finish = val;
          ++_finish;
        }
      }
      else
      {
        _finish = _start + n;
      }
    }

3.3 pop_back

pop_back 很简单,只需要 - -finish 就可以了。

但是需要考虑删完的情况,我们这里采用暴力的处理方式 —— 断言。

    void pop_back() 
    {
      assert(_finish > _start);
      --_finish;
    }

测试一下上面的函数:

  void Test3()
  {
    vector<string> v;      // 在vector里放string
    v.push_back("1");
    v.push_back("2");
    v.push_back("3");
    v.push_back("4");
    v.push_back("5");
    v.push_back("6");
    v.push_back("7");
    v.push_back("8");
    v.push_back("9");
 
    for (const auto& e : v)
    {
      cout << e << " ";
    }
    cout << endl;
    cout << v.size() << " " << v.capacity() << endl;
 
    v.resize(50,"x");
    cout << v.size() << " " << v.capacity() << endl;
 
    v.pop_back();
    v.pop_back();
    v.pop_back();
    for (const auto& e : v)
    {
      cout << e << " ";
    }
    cout << endl;
    cout << v.size() << " " << v.capacity() << endl;
  }
}

4.  insert和erase迭代器失效问题

什么是迭代器失效?

" 迭代器失效是一种现象,由特定操作引发,这些特定操作对容器进行操作,使得迭代器不指向容器内的任何元素,或者使得迭代器指向的容器元素发生了改变。"

迭代器的主要作用就是让算法能够不用关心底层数据结构,其底层实际就是一个指针,


或者是对指针进行了封装,比如:vector 的迭代器就是原生态指针 T* 。


因此迭代器失效,实际就是迭代器底层对应指针所指向的空间被销毁了,


而使用一块已经被释放的空间,造成的后果是程序崩溃,


即,如果继续使用已经失效的迭代器,程序可能会出现崩溃。

4.1 insert

插入可分为四个步骤:① 检查 pos 是否越界   ② 检查是否需要扩容  ③ 移动数据   ④ 插入数据

    void insert(iterator pos, const T& val)
    {
      assert(pos >= _start);// ①检查pos是否越界
      assert(pos <= _finish);
 
      if (_finish == _end_of_storage)// ②检查是否需要扩容
      {
        reserve(capacity() == 0 ? 4 : capacity() * 2);
      }
 
      iterator right = _finish - 1;// ③移动数据
      while (right >= pos)
      {
        *(right + 1) = *right;
        --right;
      }
 
      *pos = val;// ④插入数据
      ++_finish;
    }


测试:在2的位置前插入一个20

  void Test4()
  {
    vector<int> v1;
    v1.push_back(1);
    v1.push_back(2);
    v1.push_back(3);
    vector<int>::iterator pos = find(v1.begin(), v1.end(), 2);
    if (pos != v1.end()) 
    {
      v1.insert(pos, 20);
    }
    for (const auto& e : v1)
    {
      cout << e << " "; 
    }
    cout << endl;
  }

继续在2的位置前插入一个20:

    void Test4()
  {
    vector<int> v1;
    v1.push_back(1);
    v1.push_back(2);
    v1.push_back(3);
    vector<int>::iterator pos = find(v1.begin(), v1.end(), 2);
    if (pos != v1.end()) 
    {
      v1.insert(pos, 20);
    }
    for (const auto& e : v1)
    {
      cout << e << " "; 
    }
    cout << endl;
 
    pos = find(v1.begin(), v1.end(), 2);
    if (pos != v1.end())
    {
      v1.insert(pos, 20);
    }
    for (const auto& e : v1)
    {
      cout << e << " "; 
    }
    cout << endl;
  }

是什么问题出现了随机值?机智的童鞋已经想到:

迭代器失效问题。扩容导致的 pos 失效,我们的 insert 没有去处理这个问题。

如果发生扩容,我们的 pos 是不是应该去更新一下?:

    void insert(interator pos, const T& val)
    {
      assert(pos >= _start);// ①检查pos是否越界
      assert(pos <= _finish);
 
      if (_finish == _end_of_storage)// ②检查是否需要扩容
      {
        size_t len = pos - _start;// 记录一下pos到_start的距离
        reserve(capacity() == 0 ? 4 : capacity() * 2);
        pos = _start + len;// 迭代器失效问题,扩容后pos还是指向原来的空间,更新一下pos,
      }
 
      interator right = _finish - 1;// ③移动数据
      while (right >= pos)
      {
        *(right + 1) = *right;
        --right;
      }
 
      *pos = val;// ④插入数据
      ++_finish;
    }

但是外面的 pos(实参) 还是失效的,这里是传值,pos(形参) 是 pos(实参) 的临时拷贝。


如果 insert 中发生了扩容,那么会导致 pos(实参)指向空间被释放。


pos(实参) 本身就是一个野指针,这种问题我们称之为 —— 迭代器失效


如何解决这里的迭代器失效问题?传引用?


传引用当然时不好的,如果我传给你一个begin呢,传引用不能彻底解决所有问题。

我们来看看巨佬是如何解决这一问题的:

是通过返回值去拿的,返回新插入的迭代器。

如果迭代器失效了,你想拿另一个迭代器去代替,就可以通过返回值去拿一下:

    iterator insert(iterator pos, const T& val)
    {
      assert(pos >= _start);// ①检查pos是否越界
      assert(pos <= _finish);
 
      if (_finish == _end_of_storage)// ②检查是否需要扩容
      {
        size_t len = pos - _start;// 记录一下pos到_start的距离
        reserve(capacity() == 0 ? 4 : capacity() * 2);
        pos = _start + len;// 迭代器失效问题,扩容后pos还是指向原来的空间,更新一下pos,
        //而且形参不会影响实参,传引用的话begin等就传不了,所以用返回解决
      }
 
      iterator right = _finish - 1;// ③移动数据
      while (right >= pos)
      {
        *(right + 1) = *right;
        --right;
      }
 
      *pos = val;// ④插入数据
      ++_finish;
      return pos;
    }

c2ba2aa7f04c4ecc88b321a56b328457.png

从C语言到C++_15(vector的模拟实现)+迭代器失效问题(下):https://developer.aliyun.com/article/1521305

目录
相关文章
|
5月前
|
安全 C语言 C++
比较C++的内存分配与管理方式new/delete与C语言中的malloc/realloc/calloc/free。
在实用性方面,C++的内存管理方式提供了面向对象的特性,它是处理构造和析构、需要类型安全和异常处理的首选方案。而C语言的内存管理函数适用于简单的内存分配,例如分配原始内存块或复杂性较低的数据结构,没有构造和析构的要求。当从C迁移到C++,或在C++中使用C代码时,了解两种内存管理方式的差异非常重要。
202 26
|
10月前
|
算法 编译器 C++
模拟实现c++中的vector模版
模拟实现c++中的vector模版
|
存储 编译器 C语言
【c++丨STL】vector的使用
本文介绍了C++ STL中的`vector`容器,包括其基本概念、主要接口及其使用方法。`vector`是一种动态数组,能够根据需要自动调整大小,提供了丰富的操作接口,如增删查改等。文章详细解释了`vector`的构造函数、赋值运算符、容量接口、迭代器接口、元素访问接口以及一些常用的增删操作函数。最后,还展示了如何使用`vector`创建字符串数组,体现了`vector`在实际编程中的灵活性和实用性。
699 4
|
12月前
|
存储 对象存储 C++
C++ 中 std::array<int, array_size> 与 std::vector<int> 的深入对比
本文深入对比了 C++ 标准库中的 `std::array` 和 `std::vector`,从内存管理、性能、功能特性、使用场景等方面详细分析了两者的差异。`std::array` 适合固定大小的数据和高性能需求,而 `std::vector` 则提供了动态调整大小的灵活性,适用于数据量不确定或需要频繁操作的场景。选择合适的容器可以提高代码的效率和可靠性。
|
12月前
|
存储 编译器 C语言
【c++丨STL】vector模拟实现
本文深入探讨了 `vector` 的底层实现原理,并尝试模拟实现其结构及常用接口。首先介绍了 `vector` 的底层是动态顺序表,使用三个迭代器(指针)来维护数组,分别为 `start`、`finish` 和 `end_of_storage`。接着详细讲解了如何实现 `vector` 的各种构造函数、析构函数、容量接口、迭代器接口、插入和删除操作等。最后提供了完整的模拟实现代码,帮助读者更好地理解和掌握 `vector` 的实现细节。
277 0
|
算法 编译器 C语言
【C语言】C++ 和 C 的优缺点是什么?
C 和 C++ 是两种强大的编程语言,各有其优缺点。C 语言以其高效性、底层控制和简洁性广泛应用于系统编程和嵌入式系统。C++ 在 C 语言的基础上引入了面向对象编程、模板编程和丰富的标准库,使其适合开发大型、复杂的软件系统。 在选择使用 C 还是 C++ 时,开发者需要根据项目的需求、语言的特性以及团队的技术栈来做出决策。无论是 C 语言还是 C++,了解其优缺点和适用场景能够帮助开发者在实际开发中做出更明智的选择,从而更好地应对挑战,实现项目目标。
445 0
|
3月前
|
存储 C语言
`scanf`是C语言中用于按格式读取标准输入的函数
`scanf`是C语言中用于按格式读取标准输入的函数,通过格式字符串解析输入并存入指定变量。需注意输入格式严格匹配,并建议检查返回值以确保读取成功,提升程序健壮性。
1009 0
|
11月前
|
存储 算法 C语言
【C语言程序设计——函数】素数判定(头歌实践教学平台习题)【合集】
本内容介绍了编写一个判断素数的子函数的任务,涵盖循环控制与跳转语句、算术运算符(%)、以及素数的概念。任务要求在主函数中输入整数并输出是否为素数的信息。相关知识包括 `for` 和 `while` 循环、`break` 和 `continue` 语句、取余运算符 `%` 的使用及素数定义、分布规律和应用场景。编程要求根据提示补充代码,测试说明提供了输入输出示例,最后给出通关代码和测试结果。 任务核心:编写判断素数的子函数并在主函数中调用,涉及循环结构和条件判断。
636 23
|
5月前
|
安全 C语言
C语言中的字符、字符串及内存操作函数详细讲解
通过这些函数的正确使用,可以有效管理字符串和内存操作,它们是C语言编程中不可或缺的工具。
325 15
|
10月前
|
人工智能 Java 程序员
一文彻底搞清楚C语言的函数
本文介绍C语言函数:函数是程序模块化的工具,由函数头和函数体组成,涵盖定义、调用、参数传递及声明等内容。值传递确保实参不受影响,函数声明增强代码可读性。君志所向,一往无前!
415 1
一文彻底搞清楚C语言的函数