一、vector和string的联系与不同

vector底层也是用动态顺序表实现的，和string是一样的，但是string默认存储的就是字符串，而vector的功能较为强大一些，vector不仅能存字符，理论上所有的内置类型和自定义类型都能存，vector的内容可以是一个自定义类型的对象，也可以是一个内置类型的变量。

vector在使用时需要进行类模板的实例化，因为传递的模板参数不同，则vector存储的元素类型就会有变化，所以在使用vector的时候要进行类模板的显式实例化。

类模板的第二个参数是空间配置器，这个学到后面再说，而且这个参数是有缺省值的，我们只用这个缺省值就欧克了，所以在使用vector时，只需要关注第一个参数即可。

void test_vector1()
{
  string s;
  vector<int> v;
  v.push_back(1);
  v.push_back(2);
  v.push_back(3);
  v.push_back(4);
  //string和vector底层都是用数组实现的，所以他们都支持迭代器、范围for、下标+[]的遍历方式
  for (size_t i = 0; i < v.size(); i++)
  {
    cout << v[i] << " ";//string和vector的底层都是数组，所以可以使用[]，但list就不能使用[]了，所以万能的方法是迭代器。
  }
  cout << endl;
  vector<int>::iterator it = v.begin();//iterator实际是某种类型的重定义，在使用时要指定好类域。
  while (it != v.end())
  {
    cout << *it << " ";
    ++it;
  }
  cout << endl;
  for (auto e : v)//不就是迭代器吗？
  {
    cout << e << " ";
  }
  cout << endl;
  cout << v.max_size() << endl;//int是10亿多，因为int占4个字节，42亿÷4。
  cout << s.max_size() << endl;//max_size的大小是数据的个数，我的编译器的char是21亿多。不用管他，这接口没价值。
  //vector<char> vstr;
  //string str;
  //vector<char>不能替代string，即使两者都是字符数组也不行，因为string有\0
}

二、vector的扩容操作

1.resize() （缺省值为匿名对象）&& reserve()

对于string和vector，reserve和resize是独有的，因为他们的底层都是动态顺序表实现的，list就没有reserve和resize，因为他底层是链表嘛。

对于reserve这个函数来说，官方并没有将其设定为能够兼容实现缩容的功能，明确规定这个函数在其他情况下，例如预留空间要比当前小的情况下，这个函数的调用是不会引起空间的重新分配的，也就是说容器vector的capacity是不会被影响的。

有的人可能认为缩容只要丢弃剩余的空间就好了，但其实没有那么简单，你从C语言阶段free空间不能分两次free进行释放就可以看出来，一块已经申请好的空间就是一块儿独立的个体，不能说你保留空间的一部分丢弃剩余的一部分，这样是不行的，本质上和操作系统的内存管理有关系，如果对这部分知识有兴趣，可以下去研究一下。

但值得注意的是缩容表面看起来是降低了空间的使用率，想要提高程序的效率，但实际上并未提高效率，缩容是需要异地缩容的，需要重新开空间和拷贝数据，代价不小，所以平常不建议对空间进行缩容。

vector的resize和string的resize同样具有三种情况，但vector明显功能比string要更健壮一些，string类型只能针对于字符，而vector在使用resize进行初始化空间数据时，对内置类型和自定义类型均可以调用对应的拷贝构造来初始化，所以其功能更为健壮，默认将整型类型初始化为0，指针类型初始化为空指针。

void test_vector2()
{
  vector<int> v;
  v.push_back(1);
  v.push_back(2);
  v.push_back(3);
  v.push_back(4);
  v.push_back(5);
  //resize和reserve对于vector和string是独有的，对于list而言，就没有reserve和resize
  cout << v.capacity() << endl;
  v.reserve(10);
  cout << v.capacity() << endl;
  v.reserve(4);
  cout << v.capacity() << endl;//并不会缩容，缩容并不会提高效率，缩容是有代价的，某种程度上就是以空间换时间。
  v.resize(8);//int、指针这些内置类型的默认构造就把他们初始化为0和空指针这些。
  v.resize(15, 1);
  v.resize(3);//不缩容，也是采用惰性删除的方式，将size调整为3就可以了，显示数组内容的时候按照size大小显示就可以了。
}

2.reserve在g++和vs上的扩容机制

1.
在vs上扩容机制采用1.5倍的大小，g++上采用2倍的大小，对于空间的扩容，如果开大了会造成空间浪费，开小了不够用，又会导致频繁扩容带来性能的损耗，而2倍的大小可以说是刚刚好，至于微软的工程师为什么选择1.5来进行扩容，是由于内存的某种对其因素导致。

void test_vector_expand()//扩容机制大概是1.5倍进行扩容
{
  size_t sz;
  vector<int> v;
  //v.reserve(100);//已知开辟空间大小时，我们应该调用reserve来提前预留空间，进行扩容。
  sz = v.capacity();
  cout << "making v grow:\n";
  for (int i = 0; i < 100; ++i)
  {
    v.push_back(i);
    if (sz != v.capacity())
    {
      sz = v.capacity();
      cout << "capacity changed: " << sz << '\n';
    }
  }
}

3.reserve异地扩容和shrink_to_fit异地缩容的设计理念

对于reserve的设计理念就是不去缩容，就算手动调用reserve进行缩容，编译器也不会理你，空间的大小始终都不会变，capacity的值一直是不动的，这样的设计理念本质上就是用空间来换时间，因为异地缩容需要开空间和拷贝数据，比较浪费时间。

相反shrink_to_fit就是缩容函数，强制性的将capacity的大小降低到适配size大小的值，它的设计理念就是以空间来换时间，但日常人们所使用的手机或者PC空间实际上是足够的，不够的是时间，所以这种函数还是不要使用的为好，除非说你后面肯定不会插入数据了，不再进行任何modify操作，那你可以试着将空间还给操作系统，减少空间的使用率。

void test_vector7()
{
  vector<int> v;
  v.reserve(10);
  v.push_back(1);
  v.push_back(2);
  v.push_back(3);
  v.push_back(4);
  v.push_back(5);
  cout << v.size() << endl;
  cout << v.capacity() << endl;
  //C++不会太推荐使用malloc来进行空间的初始化了，因为很有可能存在自定义类型对象没有初始化的问题，如果用new会自动调用构造。
  //设计理念就是不去缩容，因为异地缩容的代价很大，所以就算你用reserve或是resize调整大小以改变capacity，但编译器不会管你。
  // 因为它的设计理念不允许它这么做，而遇到shrink_to_fit就没辙了，因为他是缩容函数！！！
  //---不动空间，不去缩容，以空间换时间的设计理念，因为缩容虽然空间资源多了，但是时间就长了，为了提高时间，就用空间换。
  //shrink_to_fit就是反面的函数，进行了缩容。
  v.reserve(3);
  cout << v.size() << endl;
  cout << v.capacity() << endl;
  //设计理念：以时间换空间，一般缩容都是异地缩容，代价不小，一般不要轻易使用。通常情况下，我们是不缺空间的，缺的是时间。
  v.shrink_to_fit();//缩容函数，代价很大，通常的缩容的方式，就是找一块新的较小的空间，然后将原有数据拷贝进去
  v.resize(3);
  cout << v.size() << endl;
  cout << v.capacity() << endl;
  v.clear();//clear都是不动空间的
}

4.vector和malloc分别实现动态开辟的二维数组

杨辉三角

对于C语言实现的话，需要一个返回值和两个输出型参数来返回到后台接口里面，第一个参数代表二维数组的大小，这道题我们知道返回的二维数组的大小，但其他题是有可能不知道的，而leetcode的后台测试用例是统一设计的，为了兼容其他不知道返回数组大小的题目，这里统一使用了输出型参数来控制。第二个参数的原因也是如此。

二维数组、二维数组里面的元素、需要返回二维数组里面的一维数组的元素个数，这些数组都需要malloc出来。

//后台实现的地方：int returnSize=0;int returnColumnSizes[];
//grenerate(num,&returnSize,&returnColumnSizes);//函数调用
int** generate(int numRows, int* returnSize, int** returnColumnSizes) 
{
    int** p = (int**)malloc(numRows * sizeof(int*));
    *returnSize = numRows;
    *returnColumnSizes = (int*)malloc(sizeof(int) * numRows);
    for (int i = 0; i < numRows; i++)
    {
        p[i] = (int*)malloc(sizeof(int) * (i + 1));//给每一个二维数组的元素动态开辟一个空间
        (*returnColumnSizes)[i] = i + 1;
        p[i][0] = p[i][i] = 1;
        //for(int j = i; j < i + 1; j++)//条件控制有问题
        //for (int j = 0; j < i + 1 ; j++)
        for (int j = 1; j < i ; j++)
        {
            if (p[i][j]!=1)
            {
                p[i][j]=p[i-1][j-1]+p[i-1][j];
            }
        }
    }
    return p;
}

3.
对于vector来讲的话，动态开辟就不需要我们自己做，通过resize就可以控制容器的空间大小，不用malloc动态开辟了，所以对于动态开辟的二维数组来讲，vector实际上要简便许多。

class Solution {
public:
    vector<vector<int>> generate(int numRows) {
        vector<vector<int>> vv;
        vv.resize(numRows);
        //第二个参数不传就是匿名对象，会自动调用容器中元素的构造函数。内置类型或自定义类型的构造。
        for(size_t i=0; i<vv.size(); i++)
        {
            vv[i].resize(i+1, 0);//给每一个vector<int>容器预留好空间并进行初始化
            vv[i][0] = vv[i][vv[i].size() - 1] = 1;
        }
        for(int i=0; i<vv.size(); i++)
        {
            for(int j=0; j<vv[i].size(); j++)
            {
                if(vv[i][j]==0)
                {
                    vv[i][j]=vv[i-1][j]+vv[i-1][j-1];
                }
            }
        }
        return vv;
    }
};

三、vector的元素访问操作

1.operator[]和at对于越界访问的检查机制（一段经典的代码错误）

下面所展示的代码是比较经典的错误，就是我们用reserve扩容之后，就利用[]和下标来进行容器元素的访问，扩容之后空间的使用权确实属于我们，但是operator[]的越界访问检查机制，导致了我们程序的崩溃，assert(pos<size)，所以对于元素的访问，是要用resize来进行size的调整的，而reserve的主要作用是用来提前预留空间，在空间不够使用的情况下进行调用，所以这里使用的情景有些不搭。

对于at的使用，所采用的越界访问检查机制是抛异常，catch捕获异常之后，我们可以将异常信息打印出来，可以看到异常信息是无效的vector下标，指的也是所传下标是无用的，实际就是下标位置超过了size。

void test_vector4()
{
  vector<int> v;
  v.reserve(10);
  //这是一段经典的错误代码。reserve改变的是capacity主要解决的是插入数据时涉及到的扩容问题。
  //resize改变的是size，平常对于vector的容量增加，还是resize多一点，resize可以直接包揽reserve的活，并且除此之外还能初始化空间。
  for (size_t i = 0; i < 10; i++)
  {
    //v[i] = i;
    //对于[]的使用实际会有一个assert的越界断言的检查。assert(i<v.size())，你的下标不能超过size。
    //虽然reserve的确把空间开辟好了，你也能用这个空间，但是[]他有size和下标的越界检查，所以你的程序就会报错。
    //reserve=开空间+初始化（有默认值）
    v.at(i) = i;//抛异常
    //断言报错真正的问题是在于,release版本下面，断言就失效了，断言在release版本下面是不起作用的。
  }
}
int main()
{
  //test_vector1();
  //test_vector2();
  //test_vector_expand();
  try
  {
    //test_vector6();
  }
  catch (const exception& e)
  {//在这个地方捕获异常然后进行打印
    cout << e.what() << endl;//报错valid vector subscript，无效的vector下标
  }
  //test_vector4();
  //test_vector5();
  //test_vector6();
  test_vector7();
  //string算是STL的启蒙，string的源码我们就不看了
  return 0;
}

四、vector的修改操作

1.assign和迭代器的配合使用

assign有两种使用方式，一种是用n个value来进行容器元素的覆盖，一种是用迭代器区间的元素来进行容器元素的覆盖，这里的迭代器采用模板形式，因为迭代器类型不仅仅可能是vector类型，也有可能是其他容器类型，所以这里采用模板泛型的方式。

2.
而且迭代器使用起来实际是非常方便的，由于vector的底层是连续的顺序表，所以我们可以通过指针±整数的方式来控制迭代器赋值的区间，所以采用迭代器作为参数是非常灵活的。

void test_vector5()
{
  vector<int> v;
  v.push_back(1);
  v.push_back(2);
  v.push_back(3);
  for (auto e : v)
  {
    cout << e << " ";
  }
  cout << endl;
  //void assign(size_type n, const value_type & val);前后类型分别为size_t和模板参数T的类型typedef，那就是int类型
  v.assign(10, 1);
  for (auto e : v)
  {
    cout << e << " ";
  }
  cout << endl;
  vector<int> v1;
  v1.push_back(10);
  v1.push_back(20);
  v1.push_back(30);
  //template <class InputIterator> void assign(InputIterator first, InputIterator last);
  v.assign(v1.begin(), v1.end());
  for (auto e : v)
  {
    cout << e << " ";
  }
  cout << endl;
  string str("hello world");
  v.assign(str.begin(), str.end());//assign里面的迭代器类型是不确定的，既有可能是他自己的iterator也有可能是其他容器的迭代器类型。
  for (auto e : v)
  {
    cout << e << " ";
  }
  cout << endl;
  v.assign(++str.begin(), --str.end());//你可以控制迭代器的区间，指定assign的容器元素内容的长度。
  for (auto e : v)
  {
    cout << e << " ";
  }
  cout << endl;
}

2.insert和find的配合使用

对于顺序表这种结构来说，头插和头删的效率是非常低的，所以vector只提供了push_back和pop_back，而难免遇到头插和头删的情况时，可以偶尔使用insert和erase来进行头插和头删，并且insert和erase的参数都使用了迭代器类型作为参数，因为迭代器更具有普适性。

如果要在vector的某个位置进行插入时，肯定是需要使用find接口的，但其实vector的默认成员函数并没有find接口，这是为什么呢？因为大多数的容器都会用到查找接口，也就是find，所以C++直接将这个接口放到算法库里面去了，实现一个函数模板，这个函数的实现实际也比较简单，只要遍历一遍迭代器然后返回对应位置的迭代器即可，所以这个函数不单独作为某个类的成员函数，而是直接放到了算法库里面去。

void test_vector6()//测试insert和find
{
  vector<int> v;
  v.push_back(1);
  v.push_back(2);
  v.push_back(3);
  v.insert(v.begin(), 4);
  v.insert(v.begin() + 2, 4);
  //vector的迭代器能够直接+2，源自于vector的底层是连续的空间，迭代器也就是连续的，而list的底层不是连续空间，而是一个个的节点，
  //所以迭代器就不能++来进行使用了
  //如果要在vector里面的数字3位置插入一个元素的话：std::find，find的实现就是遍历一遍迭代器，找到了就返回对应位置的迭代器。
  //而vector、list、deque等容器都会用到find，所以find直接实现一个模板即可。
  vector<int>::iterator it = std::find(v.begin(), v.end(), 3);
  //string没有实现find的原因是string不仅仅要找某一个字符，而且还要找一个字串，所以算法库的find就不怎么适用，string就自己造轮子
  v.insert(it, 30);
  for (auto e : v)
  {
    cout << e << " ";
  }
  cout << endl;
}

3.类外、类内、算法库的3个swap

vector类内的swap用于两个对象的交换，在swap实现里面再调用std的swap进行内置类型的交换，但C++用心良苦，如果你不小心使用的格式是std里面的swap格式的话，也没有关系，因为类外面有一个匹配vector的swap，所以会优先调用类外的swap，C++极力不想让你调用算法库的swap，就是因为如果交换的类型是自定义类型的情况下，算法库的swap会进行三次深拷贝，代价极大，所以为了极力防止你调用算法库的swap，C++不仅在类内定义了swap，在类外也定义了已经实例化好的swap，调用时会优先调用最匹配的swap。

void test_vector8()
{
  vector<int> v;
  v.push_back(1);
  v.push_back(2);
  v.push_back(3);
  vector<int> v1;
  v1.swap(v);
  swap(v1, v);//一不小心这样用呢？那也不会去调用算法库里面的三次深拷贝的swap
  //这里会优先匹配vector的类外成员函数，既然有vector作为类型实例化出来的swap函数模板，就没有必要调用算法库里面的模板进行实例化
  //template <class T, class Alloc>
  //void swap(vector<T, Alloc>&x, vector<T, Alloc>&y);
}

五、看源码时需要注意的问题

看源码框架的方法：将类成员变量先抽出来，看一看成员函数的声明具体都实现了什么功能，如果想要看实现，那就去.c文件抽出来具体函数去看

看某些书籍时的道理和看源码是一样的，要进行抽丝剥茧，不要想着第一遍就把看到的所有东西都弄回，如果你觉得这本书或源码非常不错，你可以多次反复的去看，要循序渐进的去学，一段时间之后，你的知识储备上来之后，可能再去看书籍或者源码又有新的不同的感受，所以不要想着一遍就把所有的东西都搞明白，第一遍弄懂个70%-80%就很不错，如果你想学扎实一点，那就增加遍数。

【C++】vector的基本使用