【C++】vector的简化模拟实现

简介: 【C++】vector的简化模拟实现

1. 主要结构


参照SGI版本的vector实现,使用三个指针来维护这样一段内存空间

tem


图示结构如下:

c9acbaca2293a84b2c2af408e7c51196.png

那么,对于vector的模拟实现和string的实现就有所不同了。


2. 默认成员函数


✅对于默认构造函数,我们不需要对其进行开辟空间等操作,所以直接在初始化列表给定三个成员变量空指针即可

vector()
:_start(nullptr)
,_finish(nullptr)
,_endOfStorage(nullptr)
{}


✅对于给定长度和值的构造函数,我们需要开辟空间,然后把val都填进去,但是这里对于开辟空间的操作,我们复用reserve即可,这样如果出现某些需要对开辟空间操作的修改,只需要修改reserve即可,提高了代码的可维护性

vector(size_t n, const T& val = T())
{
    reserve(n);
    for (size_t i = 0; i < n; ++i)
    {
        push_back(val);
    }
}


✅对于迭代器区间的初始化,按照迭代器的自增行为遍历整个迭代器区间,并将每个元素尾插到vector中。

template<class InputIterator>
vector(InputIterator first, InputIterator last)
{
    while (first != last)
    {
        push_back(*first);
        ++first;
    }
}


✅对于拷贝构造,我们同样有经典写法和现代写法两种,由于现代写法的可读性更优,所以这里对于经典写法我们就不再赘述。现代写法,我们的想法是找到一个“工具人”tmp来帮我们构造,这里用到了迭代器区间初始化的方式来初始化tmp,然后再通过swap函数将tmp与this指针指向的对象进行交换从而实现了拷贝构造。

vector(const vector<T>& v)
    :_start(nullptr)
    , _finish(nullptr)
    , _endOfStorage(nullptr)
{
    vector<T> tmp(v.begin(), v._end());
    swap(tmp);
}

✅对于析构函数,我们要做的事情就是释放new申请的资源,然后将成员变量置空即可。

~vector()
{
    delete[] _start;
    _start = _finish = _endOfStorage = nullptr;
}


✅对于赋值重载,我们同样找到了一个“工具人”tmp,在传参的过程中,使用传值的方式,构建了一个变量tmp,然后使用在vector类内部实现的swap交换this指针指向的类和tmp。

vector<T>& operator=(vector<T> tmp)
    : _start(nullptr)
    , _finish(nullptr)
    , _endOfStorage(nullptr)
{
  swap(tmp);
    return *this;
}


3. 迭代器


vector和string的底层都是动态数组,所以对于vector类来说,原生指针也能够很好的支持迭代器行为。这里我们只实现正向迭代器的const和非const版本。

typedef T* iterator;
typedef const T* const_iterator;
iterator begin()
{
    return _start;
}
iterator end()
{
    return _finish;
}
const_iterator begin() const
{
    return _start;
}
const_iterator end() const
{
    return _finish;
}


4. 容量相关


1. size和capacity

由于vector和string的成员变量不同,所以这里我们的size和capacity不能直接得到,需要进行运算

0017f2fbf2856770f425abca3faef1be.png

//按照图示的理解,由于指向数组的指针都是前闭后开,所以直接使用指针相减即可
size_t size()
{
    return _finish - _start;
}
size_t capacity()
{
    return _endOfStorage - _start;
}

2. reserve

如果我们做了扩容操作,就一定是异地扩容,所以对于_finish和_endOfStorage的处理就要注意一下,提前将size保存一下,否则如果在_start重新赋值之后再调用size就会出现问题。

void reserve(size_t n)
{
    if (capacity() < n)
    {
        size_t OldSize = size();
        T* tmp = new T[n];
        memcpy(tmp, _start, sizeof(T) * size());
        delete[] _start;
        _start = tmp;
        _finish = _start + OldSize;
        _endOfStorage = _start + n;
    }
}


那么,这样做了修改之后是不是就没有问题了呢?

这里注意一下,我们写的vector是一个类模板,其中存放的元素类型可以是任意类型,如果这里vector中存放的元素类型是需要深拷贝的,例如vector中存放的是string对象的时候,结构如下图。

080eef5f7a9050e3b9715014cf277472.png

按照我们刚刚实现的逻辑,首先开辟一块新的空间,然后按照值拷贝的方式将vector中存放的元素拷贝到tmp中,然后调用vector的析构函数,析构的时候对于string对象,自动调用string的析构函数,将string指向的空间,即上述的绿色部分的空间释放,然后导致新开辟的空间中的string对象全部都无效。最终在该vector对象生命周期结束时,再次调用析构函数,导致其中的每个string对象都析构两次,程序崩溃(或者在结束之前对其中的stirng对象做操作,导致出现其他问题使程序崩溃)


那么应该怎么解决这个问题呢?


不能调用库函数memcpy执行值拷贝,而是自己重新写一个拷贝的操作

void reserve(size_t n)
{
    if (capacity() < n)
    {
        size_t OldSize = size();
        T* tmp = new T[n];
        //memcpy(tmp, _start, sizeof(T) * size());
        if (_start)
        {
            for (size_t i = 0; i < OldSize; ++i)
            {
                tmp[i] = _start[i];
            }
            delete[] _start;
        }
        _start = tmp;
        _finish = _start + OldSize;
        _endOfStorage = _start + n;
    }
}


3. resize


这里resize的用法是和之前string中resize的用法相同,所以设计思路也是相同的,一共分成三种情况:

  1. 当传入的n>capcaity时,进行扩容操作,然后再填充数据
  2. 当 size < n < capacity时,直接填充数据
  3. 当n < size时,更改_finish的指向即可
void resize(size_t n, const T& val = T())
{
    if (n > capacity())//n>capacity
    {
        reserve(n);
    }
    if (n > size())//size < n < capacity
    {
        while (*_finish > _size + n)
        {
            *_finish = val;
            ++_finish;
        }
    }
    else
        _finish = _start + n;
}

这里补充一下,在上面的代码中,可以看到给val的缺省值是T(),而不是一个确定的值,这是因为存在vector中的元素可以是任意类型,有可能是自定义类型,如果使用某一个值可能无法构造出该类型的对象,所以使用T()构建一个T类型的匿名对象。


❓对于内置类型,怎么会有默认构造函数呢?


✅在C++中,为了支持这种写法,对于内置类型,也支持了使用类型()的方式创建对象


5. 数据访问


针对数据访问,我们同样只实现一个[]的重载即可

T& operator[](size_t pos)//const版本
{
    assert(pos < size());
    return _start[pos];
}
const T& operator[](size_t pos) const//非const版本
{
    assert(pos < size());
    return _start[pos];
}


6. 数据修改


1. push_back

老规矩,首先判断容量,如果已经没有容量插入就先扩容,然后在_finish指向的位置插入值,然后让_finish向后挪动一位

void push_back(const T& val)
{
    if (_finish == _endOfStorage)
    {
        size_t newCapacity = capacity() == 0 ? 4 : 2 * capacity();
        reserve(newCapacity);
    }
    *_finish = val;
    ++_finish;
}


2.pop_back

显而易见,直接使_finish向前挪动一位即可,但是最好首先进行一下判空,这里顺便也实现以下empty

bool empty()
{
    return _start == _finish;
}
void pop_back()
{
    if (!empty())
    {
        --_finish;
    }
}


3. insert

对于insert,我们在上一篇博客中讲到了迭代器失效问题,给出的解决办法就是设定返回值类型为迭代器,所以这里对insert的设计就很清晰了。

iterator insert(iterator pos, const T& val)
{
    assert(pos >= _start);
    assert(pos <= _finish);
    if (_finish == _endOfStorage)
    {
        size_t len = pos - _start;//这里注意以下,要保存pos的相对位置,否则扩容之后会导致pos位置失效
        size_t newCapacity = capacity() == 0 ? 4 : capacity() * 2;
        reserve(newCapacity);
        pos = _start + len;//重新确定pos位置
    }
    //挪动数据
    iterator end = _finish - 1;
    while (end >= pos)
    {
        *(end + 1) = *end;
        --end;
    }
    *pos = val;
    ++_finish;
    return pos;
}


4.erase

同样的erase也会导致迭代器失效,所以最终我们也重新返回一个有效的pos值

iterator erase(iterator pos)
{
    assert(pos >= _start);
    assert(pos < _finish);
    iterator begin = pos + 1;
    while (begin < _finish)
    {
        *(begin - 1) = *begin;
        ++begin;
    }
    --_finish;
    return pos;
}


5.swap

由于vector和string一样,底层都是动态数组,所以swap的形式也非常像

void swap(vector<T>& v)
{
    std::swap(_start, v._start);
    std::swap(_finish, v._finish);
    std::swap(_endOfStorage, v._endOfStorage);
}


6.clear

clear的作用就是将数据清空,但是不销毁对象,所以直接改变_finish即可

void clear()
{
    _finish = _start;
}


相关文章
|
5月前
|
存储 编译器 C++
【C++】vector介绍+模拟实现
【C++】vector介绍+模拟实现
|
2月前
|
存储 编译器 C语言
【c++丨STL】vector的使用
本文介绍了C++ STL中的`vector`容器,包括其基本概念、主要接口及其使用方法。`vector`是一种动态数组,能够根据需要自动调整大小,提供了丰富的操作接口,如增删查改等。文章详细解释了`vector`的构造函数、赋值运算符、容量接口、迭代器接口、元素访问接口以及一些常用的增删操作函数。最后,还展示了如何使用`vector`创建字符串数组,体现了`vector`在实际编程中的灵活性和实用性。
90 4
|
1月前
|
存储 对象存储 C++
C++ 中 std::array<int, array_size> 与 std::vector<int> 的深入对比
本文深入对比了 C++ 标准库中的 `std::array` 和 `std::vector`,从内存管理、性能、功能特性、使用场景等方面详细分析了两者的差异。`std::array` 适合固定大小的数据和高性能需求,而 `std::vector` 则提供了动态调整大小的灵活性,适用于数据量不确定或需要频繁操作的场景。选择合适的容器可以提高代码的效率和可靠性。
65 0
|
1月前
|
存储 编译器 C语言
【c++丨STL】vector模拟实现
本文深入探讨了 `vector` 的底层实现原理,并尝试模拟实现其结构及常用接口。首先介绍了 `vector` 的底层是动态顺序表,使用三个迭代器(指针)来维护数组,分别为 `start`、`finish` 和 `end_of_storage`。接着详细讲解了如何实现 `vector` 的各种构造函数、析构函数、容量接口、迭代器接口、插入和删除操作等。最后提供了完整的模拟实现代码,帮助读者更好地理解和掌握 `vector` 的实现细节。
42 0
|
3月前
|
存储 C++ 索引
【C++打怪之路Lv9】-- vector
【C++打怪之路Lv9】-- vector
32 1
|
3月前
|
安全 测试技术 C++
【C++篇】从零实现 C++ Vector:深度剖析 STL 的核心机制与优化2
【C++篇】从零实现 C++ Vector:深度剖析 STL 的核心机制与优化
85 6
|
3月前
|
安全 测试技术 C++
【C++篇】从零实现 C++ Vector:深度剖析 STL 的核心机制与优化1
【C++篇】从零实现 C++ Vector:深度剖析 STL 的核心机制与优化
107 7
|
3月前
|
编译器 C++
【C++】—— vector模拟实现
【C++】—— vector模拟实现
|
3月前
|
编译器 C语言 C++
【C++篇】解密 STL 动态之魂:全面掌握 C++ vector 的高效与优雅
【C++篇】解密 STL 动态之魂:全面掌握 C++ vector 的高效与优雅
68 3
|
3月前
|
C++
【C++】C++ STL探索:Vector使用与背后底层逻辑(三)
【C++】C++ STL探索:Vector使用与背后底层逻辑