C++ STL学习之【vector的模拟实现】

简介: vector 是 STL 中的容器之一,其使用方法类似于数据结构中的 顺序表,得益于范型编程和 C++ 特性的加持,vector 更强大、更全能;在模拟实现 vector 时,还需要注意许多细枝末节,否则就很容易造成重复析构及越界访问

✨个人主页: 夜 默
🎉所属专栏: C++修行之路
🎊每篇一句: 图片来源

  • The power of imagination makes us infinite.

    • 想象力的力量使我们无限。

image.png


@[toc]


🌇前言

vectorSTL 中的容器之一,其使用方法类似于数据结构中的 顺序表,得益于范型编程和 C++ 特性的加持,vector 更强大、更全能;在模拟实现 vector 时,还需要注意许多细枝末节,否则就很容易造成重复析构及越界访问

image.png

出自书籍《STL源码剖析》 侯捷著

本文重点: 深度拷贝、迭代器失效

🏙️正文

vector 的结构比较特殊,成员变量为三个指针

#pragma once
#include <iostream>
using std::cin;
using std::cout;
using std::endl;

#include <string>
using std::string;

namespace Yohifo
{
    template<class T>
    class vector
    {
    public:
        typedef T value_type;
        typedef value_type* pointer;    //指针
        typedef const value_type* const_pointer;
        typedef value_type* iterator;    //迭代器
        typedef const value_type* const_iterator;
        typedef value_type& reference;    //引用
        typedef const value_type& const_reference;
        
    private:
        iterator _start;    //指向起始位置
        iterator _finish;    //指向有效元素的下一个位置
        iterator _end_of_storage;    //指向可用空间的下一个位置
    };
}

image.png

1、默认成员函数

默认成员函数需要自己设计,因为涉及深浅拷贝问题

默认构造函数、带参构造函数、迭代器区间构造
//默认构造
vector() :_start(nullptr), _finish(nullptr), _end_of_storage(nullptr) {}

//带参构造
vector(size_t n, const T& value = T())
    :vector()
{
    reserve(n);    //扩容
    while (n--) push_back(value);    //逐个尾插
}
//额外版本,避免匹配上迭代器区间构造
vector(int n, const T& value = T())
    :vector()
{
    reserve(n);    //扩容
    while (n--) push_back(value);    //逐个尾插
}

//迭代器区间构造
template<class InputIterator>
vector(InputIterator first, InputIterator last)
    :vector()
{
    //考虑提前计算容量
    InputIterator cur = first;
    int len = 0;
    while (cur != last) ++len, ++cur;
    reserve(len);
    while (first != last) push_back(*first), ++first;
}

注意: 在设计带参构造函数时,需要再额外提供一个 vector(int n, const T& value = T()) 版本,以防使用 vector<int> v(10, 6) (构造对象,内容为10个6)优先匹配上迭代器构造,此时会造成 非法间接寻址 错误

image.png

此时多处用到了 匿名对象 作为缺省值

vector(size_t n, const T& value = T());
vector(int n, const T& value = T());

因为 T 类型不确定,在设置缺省值时,只能使用 匿名对象 的方式

  • 匿名对象 生命周期只有一行,但在被 const 修饰后,其生命周期会延长
  • 内置类型也能创建匿名对象,比如 int()char() 是合法可用的

带参构造、拷贝构造、迭代器区间构造等函数创建新对象前,需要先初始化,有多种初始化方法:

  1. 在定义成员变量后设置缺省值
  2. 在创建新对象前手动进行初始化(初始化列表)
  3. 调用 默认构造函数 进行初始化

这里采用的是初始化列表调用 默认构造函数 初始化的方式

拷贝构造
//拷贝构造-传统写法
vector(const vector<T>& v)
    :vector()
{
    reserve(v.capacity());    //扩容
    size_t pos = 0;
    while (pos < v.size()) *(_start + pos) = *(v.begin() + pos), ++pos;
    _finish = begin() + v.size();
}
////拷贝构造-现代写法
//vector(const vector<T>& v)
//    :vector()
//{
//    vector<T> tmp(v.begin(), v.end());    //构造临时对象
//    swap(tmp);    //直接交换
//}

拷贝构造对象前可以 先进行扩容,避免空间浪费; 采用逐个数据赋值拷贝的方式进行拷贝,因为 T 有可能是自定义类型,逐个赋值可以避免浅拷贝问题

  • 比如 Tstring 类型,实际调用时是这样的 this[pos] = v[pos]string 对象,调用对应的赋值重载函数)

注意:vector 的拷贝构造函数必须自己写,默认生成的是 浅拷贝

现代写法着重交换思想,利用迭代器区间构造出临时对象,再将临时对象 “交换” 给当前对象即可
这种方式有点窃取劳动成果的感觉~

赋值重载
//赋值重载-传统写法
vector<T>& operator=(const vector<T>& v)
{
    if (this != &v)
    {
        reserve(v.capacity());    //扩容
        size_t pos = 0;
        while (pos < v.size()) *(_start + pos) = *(v.begin() + pos), ++pos;
        _finish = begin() + v.size();
    }

    return *this;
}
////赋值重载-现代写法
//vector<T>& operator=(vector<T> tmp)
//{
//    swap(tmp);

//    return *this;
//}

赋值重载的传统写法与拷贝构造基本一致,赋值重载中不需要新建对象,因为是 “赋值”

注意:赋值前,可以先判断两个对象是否为同一个,如果是,则不需要进行操作

析构函数
//析构函数
~vector()
{
    delete[] _start;
    _start = _finish = _end_of_storage = nullptr;
}

_start 指向已开辟空间的首位置,可以直接进行空间释放

注意:空间申请时,使用的是 new [],因此释放时需要使用 delete []

1.1、经典问题:深度拷贝

众多构造函数都离不开空间调整函数 reserve,所以这里提前进行学习,并且 reserve 在实现时会出现一个经典问题:深浅拷贝

void reserve(size_t n)
{
    if (n > capacity())
    {
        size_t sz = size();    //需要先保存 _start 与 _finish 间的距离
        pointer tmp = new value_type[n];    //开辟新空间
        if (begin())
        {
            //memcpy(tmp, begin(), size() * sizeof(T));    //不能直接移动
            size_t pos = 0;
            while (pos < sz)
            {
                //调用自定义类型的赋值重载函数,完成深拷贝
                *(tmp + pos) = *(begin() + pos);    //深拷贝
                pos++;
            }
        }
        delete[] begin();    //释放原空间

        _start = tmp;    //赋值新空间
        _finish = _start + sz;
        _end_of_storage = _start + n;
    }
}

函数执行步骤:

  • 判断 n 是否大于容量,大于才需要进行扩容
  • 保存有效元素数(大小),后面有用
  • 三步走:开辟新空间 -> 移动元素至新空间 -> 释放旧空间,更改指向

注意:在将旧空间中的数据移动至新空间时,不能直接通过 memcpy/memmove 的方式进行数据移动,因为这些库函数都是 浅拷贝,使用后会造成重复析构问题

举例:使用 memcpy 进行数据迁移

对象中已存在字符串 This is a string,现在进行空间调整

image.png

旧空间释放后,其 string 对象被释放,与此同时新空间中的 string 对象也将同步失效

image.png

程序运行结束时,调用析构函数进行空间释放(此时会调用 string 的析构函数进行字符串释放),因为旧空间与新空间中的成员皆为同一个,所以会出现 空间重复释放问题

image.png

改良:调具体对象的赋值重载函数进行深拷贝(赋值),不再使用 memcpy 浅拷贝

image.png

实际上,拷贝构造、赋值重载、reserve 都需考虑深度拷贝的问题
一句话总结:对于自定义类型来说,在进行拷贝/赋值等操作时,调用对应的赋值重载函数即可

reserve 扩容时,发生了这些事情:

image.png

出自 《STL源码剖析》


2、迭代器相关

vector 中的迭代器就是原生指针,如 begin() == _startend() == _finish

typedef T value_type;
typedef value_type* iterator;    //迭代器
typedef const value_type* const_iterator;
        
//=====迭代器设计=====
iterator begin() { return _start; }
iterator end() { return _finish; }

const_iterator begin() const { return _start; }
const_iterator end() const { return _finish; }

注意:

  • 需要提供两个迭代器版本,即 const 对象的 const 迭代器
  • 反向迭代器在后续文章中进行专门讲解

利用前面的函数构造对象,在通过迭代器遍历对象,结果如下

image.png


3、容量相关

3.1、查看容量

直接通过迭代器获取值

//=====容量相关=====
size_t size() const { return end() - begin();  }
size_t capacity() const { return _end_of_storage - begin();  }
bool empty() const { return begin() == end();  }

3.2、容量调整

可以调整容量(reserve),也可以调整大小(resize)
reserve 前面已经介绍过了,这里来看看 resize

void resize(size_t n, const_reference val = value_type())
{
    if (n < size())
        erase(begin() + n, end());
    else
        insert(end(), n - size(), val);
}

操作步骤:

  • 判断 n 是否大于大小
  • 如果小于,执行删除,区间为 [begin() + n, end()]
  • 如果小于或等于,就执行插入,区间为 [end(), n - size(), val]

value_type 就是 T,缺省值为默认对象值


4、数据访问相关

4.1、下标访问

下标访问有两种方式:operator[]at

//=====数据访问=====
reference operator[](size_t pos)
{
    assert(pos >= 0 && pos < size());
    return *(begin() + pos);
}
const_reference operator[](size_t pos) const
{
    assert(pos >= 0 && pos < size());
    return *(begin() + pos);
}

reference at(size_t pos) { return (*this)[pos]; }
const_reference at(size_t pos) const { return (*this)[pos]; }

at 复用 operator[] 的代码,确保函数的稳定性~

4.2、首尾数据

获取首尾数据也可以直接复用 operator[]

reference front() { return (*this)[0]; }
const_reference front() const { return (*this)[0]; }
reference back() { return (*this)[size() - 1]; }
const_reference back() const { return (*this)[size() - 1]; }

测试结果如下:

image.png


5、修改相关

5.1、首尾插删

void push_back(value_type val)
{
    if (size() == capacity())
        reserve(capacity() == 0 ? 4 : capacity() * 2);    //考虑容量为0的情况

    *_finish++ = val;    //在最后一个位置插入
}

void pop_back() 
{
    assert(!empty());
    --_finish;
}

注意:尾插时,需要先判断容量是否足够,不够则需要扩容;同时因为容量默认从 0 开始,假若是第一次插入,需将容量扩容为 4

关于尾插,还有一个类似的拼接函数 assign将某段区间或 nval 值,拼接至对象后面

//=====数据修改=====
template <class InputIterator>
void assign(InputIterator first, InputIterator last)
{
    //迭代器区间拼接
    InputIterator cur = first;
    int len = 0;
    while (cur != last) ++len, ++cur;
    reserve(len);
    while (first != last) push_back(*first), ++first;
}
void assign(int n, const value_type& val)
{
    reserve(n);    //提前扩容
    while (n--) push_back(val);
}

执行结果如下:

image.png

5.2、任意位置插删

任意位置插删更为自由,同时也更加 “危险”

iterator insert(iterator pos, const_reference val)
{
    //先记录当前迭代器的位置
    size_t sz = pos - begin();
    if (size() == capacity())
        reserve(capacity() == 0 ? 4 : capacity() * 2);    //考虑容量为0的情况

    pos = begin() + sz;    //更新迭代器
    iterator cur = end();
    while (cur != pos) *cur = *(cur - 1), --cur;
    *cur = val;    //插入数据
    ++_finish;    //尾向后移动

    return pos;    //返回新迭代器位置
}
iterator insert(iterator pos, size_t n, const_reference val)
{
    while (n--) pos = insert(pos, val), pos++;    //正确写法

    return pos;
}

void erase(iterator pos)
{
    assert(pos >= begin() && pos < end());
    while (pos != end()) *pos = *(pos + 1), ++pos;
    --_finish;
}
void erase(iterator first, iterator last)
{
    //迭代器区间删除
    //两个结束条件:last == _finish
    while (last != _finish) *first = *(last + 1), ++first, ++last;
    _finish = first;

}

注意:insert 后迭代器 pos,需要及时更新

若产生扩容行为,迭代器 pos 将指向失效空间,这就是迭代器失效情况之一

image.png

image.png

迭代器失效时的具体表现:

image.png

这只是迭代器失效的其中一种情况:没有更新迭代器位置

5.3、经典问题:迭代器失效

下面再来看一个迭代器失效场景
比如下标这段代码会运行失败

void TestVector3()
{
    vector<int> v;
    
    auto it = v.begin();
    int val = 0;

    while (val < 100)
        v.insert(it++, val++);

    for (auto e : v)
        cout << e << " ";
}

结果:

image.png

原因:

image.png

我们通常认为,在 insert 后,迭代器失效,不能再使用,当然将此迭代器更新,也能正常使用

while (val < 100)
{
    it = v.insert(it, val++);
    it++:    //接收 insert 返回值,更新迭代器
}

image.png


注意:erase 后,也会出现迭代器失效情况,在 PJ 版本中,对 erase 迭代器失效情况零容忍,只要是删除后没有即使更新迭代器,就会直接报错;而在 SGI 版中,检查相对比较薄弱,即使是删除最后一个元素,它也不报错,这会导致异常行为

对于 erase 迭代器实现情况:

  • PJ 版:零容忍,检查很严格
  • SGI 版:结果未定义,缺乏检查

从实用角度来看,PJ 版的处理方法明显更合理

5.4、交换、清理、排序

再补充一些常用函数

void swap(vector<T>& v)
{
    //交换三个内置类型,效率要高得多
    std::swap(_start, v._start);
    std::swap(_finish, v._finish);
    std::swap(_end_of_storage, v._end_of_storage);
}

void clear() { erase(begin(), end()); }

即使库中提供了全局性的 std::swap 函数,vector 还是提供了额外的 swap 交换函数,因为 std::swap 中会发生多次拷贝构造,效率较低,而 swap 效率是极高的,只需交换三个成员变量

vector 中使用的是随机迭代器,可以使用库中的排序函数 std::sort

void TestVector8()
{
    int arr[] = { 1,9,5,4,3,2,6,7,10,8 };
    vector<int> v(arr, arr + sizeof(arr) / sizeof(arr[0]));

    //使用库中的排序函数
    std::sort(v.begin(), v.end());    //默认为升序(仿函数)
    //std::sort(v.begin(), v.end(), std::less<int>());    //其实默认是这样的,为缺省值

    for (auto e : v)
        cout << e << " ";
    cout << endl;


    //利用仿函数,进行降序排序
    std::sort(v.begin(), v.end(), std::greater<int>());

    for (auto e : v)
        cout << e << " ";
    cout << endl;
}

image.png

这里是第一次用到仿函数,后续在进行适配器讲解时,会详细介绍,现在只需知道怎么用就行了

对于 std::sort 来说

  • 如果想升序的话,使用 std::less<T>()
  • 降序使用 std::greater<T>()

注意:使用仿函数需要头文件 functional,使用 std::sort 需要头文件 algorithmstd::sort 函数只能用于 随机迭代器


6、源码

本文中涉及的所有代码都在这个仓库中:Gitee

image.png


🌆总结

以上就是本篇关于 vector 模拟实现的全部内容了,感兴趣的同学可以自己试着写一下,不过需要特别注意 深度拷贝迭代器失效 问题

如果你觉得本文写的还不错的话,可以留下一个小小的赞👍,你的支持是我分享的最大动力!

如果本文有不足或错误的地方,随时欢迎指出,我会在第一时间改正


image.png

相关文章推荐


C++ STL学习之【vector的使用】

===============

==STL 之 string 类==

C++ STL学习之【string类的模拟实现】

C++ STL 学习之【string】

===============

==内存、模板==

C++【模板初阶】

C/C++【内存管理】


承蒙厚爱,感谢支持.gif

目录
相关文章
|
8天前
|
C++ 开发者
C++学习之继承
通过继承,C++可以实现代码重用、扩展类的功能并支持多态性。理解继承的类型、重写与重载、多重继承及其相关问题,对于掌握C++面向对象编程至关重要。希望本文能为您的C++学习和开发提供实用的指导。
42 16
|
27天前
|
算法 网络安全 区块链
2023/11/10学习记录-C/C++对称分组加密DES
本文介绍了对称分组加密的常见算法(如DES、3DES、AES和国密SM4)及其应用场景,包括文件和视频加密、比特币私钥加密、消息和配置项加密及SSL通信加密。文章还详细展示了如何使用异或实现一个简易的对称加密算法,并通过示例代码演示了DES算法在ECB和CBC模式下的加密和解密过程,以及如何封装DES实现CBC和ECB的PKCS7Padding分块填充。
46 4
2023/11/10学习记录-C/C++对称分组加密DES
|
15天前
|
编译器 C语言 C++
【c++丨STL】list模拟实现(附源码)
本文介绍了如何模拟实现C++中的`list`容器。`list`底层采用双向带头循环链表结构,相较于`vector`和`string`更为复杂。文章首先回顾了`list`的基本结构和常用接口,然后详细讲解了节点、迭代器及容器的实现过程。 最终,通过这些步骤,我们成功模拟实现了`list`容器的功能。文章最后提供了完整的代码实现,并简要总结了实现过程中的关键点。 如果你对双向链表或`list`的底层实现感兴趣,建议先掌握相关基础知识后再阅读本文,以便更好地理解内容。
19 1
|
28天前
|
算法 C语言 C++
【c++丨STL】list的使用
本文介绍了STL容器`list`的使用方法及其主要功能。`list`是一种双向链表结构,适用于频繁的插入和删除操作。文章详细讲解了`list`的构造函数、析构函数、赋值重载、迭代器、容量接口、元素访问接口、增删查改操作以及一些特有的操作接口如`splice`、`remove_if`、`unique`、`merge`、`sort`和`reverse`。通过示例代码,读者可以更好地理解如何使用这些接口。最后,作者总结了`list`的特点和适用场景,并预告了后续关于`list`模拟实现的文章。
47 7
|
2月前
|
存储 编译器 C语言
【c++丨STL】vector的使用
本文介绍了C++ STL中的`vector`容器,包括其基本概念、主要接口及其使用方法。`vector`是一种动态数组,能够根据需要自动调整大小,提供了丰富的操作接口,如增删查改等。文章详细解释了`vector`的构造函数、赋值运算符、容量接口、迭代器接口、元素访问接口以及一些常用的增删操作函数。最后,还展示了如何使用`vector`创建字符串数组,体现了`vector`在实际编程中的灵活性和实用性。
82 4
|
2月前
|
C语言 C++ 容器
【c++丨STL】string模拟实现(附源码)
本文详细介绍了如何模拟实现C++ STL中的`string`类,包括其构造函数、拷贝构造、赋值重载、析构函数等基本功能,以及字符串的插入、删除、查找、比较等操作。文章还展示了如何实现输入输出流操作符,使自定义的`string`类能够方便地与`cin`和`cout`配合使用。通过这些实现,读者不仅能加深对`string`类的理解,还能提升对C++编程技巧的掌握。
88 5
|
2月前
|
存储 编译器 C语言
【c++丨STL】string类的使用
本文介绍了C++中`string`类的基本概念及其主要接口。`string`类在C++标准库中扮演着重要角色,它提供了比C语言中字符串处理函数更丰富、安全和便捷的功能。文章详细讲解了`string`类的构造函数、赋值运算符、容量管理接口、元素访问及遍历方法、字符串修改操作、字符串运算接口、常量成员和非成员函数等内容。通过实例演示了如何使用这些接口进行字符串的创建、修改、查找和比较等操作,帮助读者更好地理解和掌握`string`类的应用。
69 2
|
27天前
|
存储 对象存储 C++
C++ 中 std::array<int, array_size> 与 std::vector<int> 的深入对比
本文深入对比了 C++ 标准库中的 `std::array` 和 `std::vector`,从内存管理、性能、功能特性、使用场景等方面详细分析了两者的差异。`std::array` 适合固定大小的数据和高性能需求,而 `std::vector` 则提供了动态调整大小的灵活性,适用于数据量不确定或需要频繁操作的场景。选择合适的容器可以提高代码的效率和可靠性。
56 0
|
1月前
|
存储 编译器 C语言
【c++丨STL】vector模拟实现
本文深入探讨了 `vector` 的底层实现原理,并尝试模拟实现其结构及常用接口。首先介绍了 `vector` 的底层是动态顺序表,使用三个迭代器(指针)来维护数组,分别为 `start`、`finish` 和 `end_of_storage`。接着详细讲解了如何实现 `vector` 的各种构造函数、析构函数、容量接口、迭代器接口、插入和删除操作等。最后提供了完整的模拟实现代码,帮助读者更好地理解和掌握 `vector` 的实现细节。
39 0
|
4天前
|
C++ 芯片
【C++面向对象——类与对象】Computer类(头歌实践教学平台习题)【合集】
声明一个简单的Computer类,含有数据成员芯片(cpu)、内存(ram)、光驱(cdrom)等等,以及两个公有成员函数run、stop。只能在类的内部访问。这是一种数据隐藏的机制,用于保护类的数据不被外部随意修改。根据提示,在右侧编辑器补充代码,平台会对你编写的代码进行测试。成员可以在派生类(继承该类的子类)中访问。成员,在类的外部不能直接访问。可以在类的外部直接访问。为了完成本关任务,你需要掌握。
41 18