【C++从0到王者】第三十一站:map与set(下)

简介: 【C++从0到王者】第三十一站:map与set

5. equal_range

获取相等元素的范围

返回一个范围的边界,该范围包括容器中与val等效的所有元素。

因为set容器中的所有元素都是唯一的,所以返回的范围最多只包含一个元素。

如果没有找到匹配项,则返回的范围长度为0,两个迭代器都指向容器内部比较对象(key_comp)认为在val之后的第一个元素。

如果容器的比较对象自反性地返回false(即,无论元素作为参数传递的顺序如何),则认为集合中的两个元素相等。

该函数返回一个pair,其成员pair::first是范围的下界(与lower_bound相同),pair::second是上界(与upper_bound相同)。

成员类型iterator和 const_iterator是指向元素的双向迭代器类型。

我们可以看这段代码

void test_set4()
{
  std::set<int> myset;
  for (int i = 1; i <= 5; i++) myset.insert(i * 10);   // myset: 10 20 30 40 50
  std::pair<std::set<int>::const_iterator, std::set<int>::const_iterator> ret;
  ret = myset.equal_range(35);
  std::cout << "the lower bound points to: " << *(ret.first) << '\n';
  std::cout << "the upper bound points to: " << *(ret.second)<< '\n';
  myset.erase(ret.first, ret.second);
  for (auto e : myset)
  {
    cout << e << " ";
  }
  cout << endl;
}
int main()
{
  test_set4();
  return 0;
}

这是因为这段区间内并不存在35,所以会返回一个比他大的数值所在的区间。且这两个是相等的。

如果我们要找的是等于30的区间的话,就是这样的

由于set里面没有重复元素,所以其实只能找到那一个元素,从这个容器的角度来看,似乎这个寻找相等区间的函数并没有什么太大的用处,还不如find呢?

其实关于这些函数,主要还是为了另外一个容器设置的

6. multiset容器

在库里面set还有一种是multiset。

这个容器是是一个允许键值冗余的一个容器,其接口和set一模一样。所以我们可以认为,刚刚的关于一些范围的容器,都是为了它而设计的

我们可以使用一下这个容器

void test_set5()
{
  multiset<int> s;
  s.insert(1);
  s.insert(5);
  s.insert(2);
  s.insert(2);
  s.insert(2);
  s.insert(2);
  s.insert(4);
  s.insert(4);
  s.insert(4);
  s.insert(3);
  multiset<int>::iterator it = s.begin();
  while (it != s.end())
  {
    cout << *it << " ";
    it++;
  }
  cout << endl;
  //找到的是中序的第一个2,即排序的第一个2
  auto pos = s.find(2);
  while (pos != s.end())
  {
    cout << *pos << " ";
    pos++;
  }
  cout << endl;
  cout << s.count(2) << endl;
  auto ret = s.equal_range(2);
  cout << *ret.first << " " << *ret.second << endl;
  s.erase(ret.first, ret.second);
  for (auto e : s)
  {
    cout << e << " ";
  }
  cout << endl;
}
int main()
{
  test_set5();
  return 0;
}

关于上面这段代码作出如下解释:

首先这个是一个允许键值冗余的容器,所以相比于set就不会进行去重了。其余的功能和set是一样的。

由于find找的是中序的第一个2,所以我们从找到的那个开始进行打印,就会将从2以后的全部打印

其次我们的count也就可以计算出2的数量了。之前的在set中的count,由于set天然的去重了,所以只能用于检测是否存在某个值,而现在的话就可以统计数量了。

然后关于我们的找某个数的范围,这个函数也就可以查找2的所有范围了。于是我们就可以删除掉2所在的区间了。

所以count和equal_range这两个函数对于multiset容器而言更有意义。

四、map

1. map的介绍

如下所示,这个容器一共有四个参数,Key和T

映射是关联容器,存储由键值和映射值按照特定顺序组合而成的元素。

在map中,键值通常用于排序和唯一标识元素,而映射值存储与该键相关联的内容。键和映射值的类型可能不同,组合在成员类型value_type中,这是一种组合了两者的pair类型:

typdef pair<const Key, T> value_type;

在内部,map中的元素总是按照键进行严格的弱排序,排序标准由内部比较对象(类型为Compare)表示。

在通过键访问各个元素时,Map容器通常比unordered_map容器慢,但它们允许根据键的顺序直接迭代子集。

映射后的值可以通过方括号运算符((operator[])直接访问。

映射通常以二叉查找树的形式实现。

这里的模板参数中,Key和T类似于key-val模型中的key和val的模板参数。这些模板类型都被define为了key_type和mapped_type。

同时还有value_type就相当于将这两个给结合到一块,放到了pair容器中。方便我们操控里面的数据,并且里面的key_type给的是const类型,这就说明了map中的key是不可以被修改的,但是value是可以被修改的

2. map的一些常见接口以及使用

首先来看下insert,这个函数有三个重载,后两个是使用迭代器区间进行插入的。第一个是直接插入一个value_type类型的数据。value_type其实就是键值对,因为他是key-val模型的.

通过插入新元素扩展容器,实际上是插入元素的数量增加了容器的大小。

因为map中元素的键是唯一的,所以插入操作会检查每个被插入元素的键是否与容器中已经存在的元素的键相等,如果相等,则不插入该元素,并返回一个指向该元素的迭代器(如果该函数有返回值)。

有关允许重复元素的类似容器,请参阅multimap。

在map中插入元素的另一种方法是使用成员函数map::operator[]。

在内部,map容器按照比较对象指定的标准对所有元素的键进行排序。元素总是按照这种顺序插入到其各自的位置。

这些参数决定了有多少个元素被插入,以及它们被初始化到哪些值

在这里我们可能会好奇的是,为什么我们插入的值必须且最好是pair类型的呢?将这两个数据连接到一起有什么好处吗?而我们在实现key-val模型的二叉搜索树的时候却不需要呢?其实这是因为我们的二叉搜索树并没有去实现迭代器。我们如果要写迭代器一定会涉及到这个迭代器的解引用问题。而此时,我们的key-val模型里面有两种数据,而c++并不支持返回多个参数,所以只能将这两个数据给合并起来从而得以实现。

对于这个函数的返回值,他返回的也是一个pair类型的对象。

如果插入的时候key已经在树里面,那么返回pair<树里面key的迭代器,false>

如果插入的时候key并未在树里面,那么返回pair<新插入key的迭代器,true>

所以insert从某种程度上也具有了查找的功能

如下代码所示,该段代码演示了我们对map里面插入数据的几种用法,我们可以直接传一个pair对象过去,也可以传pair的匿名对象,也可以使用make_pair函数来进行,当然我们可能会认为make_pair函数要通过调用一个函数来进行创建对象对否开销有点大,其实不是的,在这里编译器会直接将这个变成内联函数进行优化,实际效率相当于直接传入一个对象。除了前面三种以外,C++11还支持了多参数的构造函数隐式类型转换。所以我们可以直接使用多参数的构造函数隐式类型转换。

上面几种方式都是非常不错的,但是比较建议使用make_pair函数来创建。这个比较简洁,且有的C++编译器如果不支持C++11的话这个函数也是可以直接使用的。

在map里面我们取出的数据都是pair类型的,这是因为C++只能返回一个值,不能返回多个值。所以我们必须使用pair对象进行返回。然后C++也不支持pair的流插入和流提取,因为并没有进行重载。所以我们需要解引用后,拿到的只是一个结构体,我们还需要在访问里面的值。或者我们可以直接使用->也是很方便的。

void test_map1()
{
  map<string, string> dict;
  pair<string, string> kv1("insert", "插入");
  dict.insert(kv1);
  dict.insert(pair<string, string>("sort", "排序"));
  dict.insert(make_pair("remove", "改革"));
  dict.insert({ "process","过程" });//C++11 多参数的构造函数隐式类型转换
  map<string, string>::iterator it = dict.begin();
  while (it != dict.end())
  {
    cout << (*it).first << (*it).second << endl;
    cout << it->first << it->second << endl;
    it++;
  }
  for (const auto& e : dict)
  {
    cout << e.first << " " << e.second << endl;
  }
}
int main()
{
  test_map1();
  return 0;
}

还需要注意的是,如果插入的时候,key相同,但是val不相同,是不会插入进去的,也不会覆盖进去的。即插入过程中,只比较key。key相同就不插入了。

上面是关于map的一些插入接口,还有一些接口是删除接口。也比较常见,三种删除,分别是直接删除某个迭代器位置的删除,或者给一个key去删除,注意不是val,只需要一个key就可以删除了。第三种就是删除一个迭代器区间。

我们也可以注意到,查找和删除都只与key有关系,与其他无关。

还有如find,count这些接口也都是属于set的设计十分类似的

获取元素的迭代器

在容器中搜索键值等于k的元素,如果找到则返回到该元素的迭代器,否则返回到map::end的迭代器。 如果容器的比较对象反射返回false,则认为两个键是等效的(即,无论元素作为参数传递的顺序如何)。 另一个成员函数map::count可以用来检查特定键是否存在。

如果找到具有指定键的元素,则返回该元素的迭代器,否则返回map::end。

如果map对象是const限定的,该函数返回一个const_iterator对象。否则,它返回一个迭代器。

计算具有特定键的元素数量

在容器中搜索键等于 k 的元素,并返回匹配的数量。

由于 map 容器中的所有元素都是唯一的,因此该函数只能返回 1(如果找到元素)或 0(否则)。

如果容器的 comparison 对象反射返回 false,则认为两个键是等效的(即,无论作为参数传递的键的顺序如何)。

3. map的[]运算符重载

当我们使用map的insert接口和find接口的时候,我们可以来实现在之前二叉搜索树中的统计水果个数的代码。

void test_map2()
{
  string arr[] = { "苹果", "西瓜", "苹果", "西瓜", "苹果", "苹果", "西瓜","苹果", "香蕉", "苹果", "香蕉" };
  map<string, int> countMap;
  for (auto e : arr)
  {
    map<string, int>::iterator pos = countMap.find(e);
    if (pos == countMap.end())
    {
      countMap.insert(make_pair(e, 1));
    }
    else
    {
      pos->second++;
    }
  }
  map<string, int>::iterator it = countMap.begin();
  while (it != countMap.end())
  {
    cout << it->first << ":" << it->second << endl;
    it++;
  }
}
int main()
{
  test_map2();
  return 0;
}

但是事实上我们可以将代码变得更加简洁。

我们来看一下map的[]运算符重载

访问元素

如果k与容器中某个元素的键匹配,则该函数返回对其映射值的引用。

如果k与容器中任何元素的键不匹配,则该函数用该键插入一个新元素,并返回对其映射值的引用。注意,这总是将容器的大小增加1,即使没有将映射值赋给元素(元素是使用其默认构造函数构造的)。

类似的成员函数map::at在具有键的元素存在时具有相同的行为,但在不存在时抛出异常。

调用此函数相当于:

(*((this->insert(make_pair(k,mapped_type()))).first)).second

简而言之,就是给一个key,如果这个key在map中存在,返回它的val,如果不存在,那么就创建一个pair对象插入进去,这个pair对象的first是key,pair中的second是val类型的默认构造函数。

这样我们就可以将上面代码简化为下面代码了。countMap对象中,它的两个参数是string和int,第一次的时候不存在,所以会创建一个pair<string,int>对象。int则会调用它的默认构造函数,即结果为0。然后有一个++,所以最终会将这个值给插入进去。

void test_map3()
{
  string arr[] = { "苹果", "西瓜", "苹果", "西瓜", "苹果", "苹果", "西瓜","苹果", "香蕉", "苹果", "香蕉" };
  map<string, int> countMap;
  for (auto e : arr)
  {
    countMap[e]++;
  }
  map<string, int>::iterator it = countMap.begin();
  while (it != countMap.end())
  {
    cout << it->first << ":" << it->second << endl;
    it++;
  }
}
int main()
{
  test_map3();
  return 0;
}

这个[]运算符重载其实就是靠插入函数实现的,因为无论插入成功与否,insert会返回一个pair对象,pair对象的first就是就是新插入进去结点或者已有结点的迭代器。然后我们直接访问这个迭代器指向的second即可。

除了上面的统计个数的场景,我们还可以试一下下面的单词翻译的场景

void test_map4()
{
  map<string, string> dict;
  pair<string, string> kv1("insert", "插入");
  dict.insert(kv1);
  dict.insert(pair<string, string>("sort", "排序"));
  dict.insert(make_pair("remove", "改革"));
  dict.insert({ "process","过程" });//C++11 多参数的构造函数隐式类型转换
  dict["remov"] = "xxx";
  dict["process"] = "进程";
  dict["access"] = "接受,道路";
  cout << (dict["set"] = "集合") << endl;
  for (auto e : dict)
  {
    cout << e.first << " " << e.second << endl;
  }
}
int main()
{
  test_map4();
  return 0;
}

我们可以注意到,通过[]运算符重载,我们可以实现对原来的值进行修改,如果原来没有可以插入。也可以进行查找+插入等等一系列操作。

4. 使用map改进一些题

力扣链接:有效的括号

对于下面这道题,我们之前就是直接一个一个匹配,但是现在,我们已经可以使用map来进行维护了,这样的话如果还有更多的括号需要进行匹配的话只需要改变map里面存储的值即可

class Solution {
public:
    bool isValid(string s) {
        stack<char> st;
        map<char,char> matchMap;
        matchMap['('] = ')';
        matchMap['['] = ']';
        matchMap['{'] = '}';
        for(auto ch : s)
        {
            if(matchMap.count(ch))
            {
                st.push(ch);
            }
            else
            {
                if(st.empty())
                {
                    return false;
                }
                char top = st.top();
                st.pop();
                if(matchMap[top]!=ch)
                {
                    return false;
                }
            }
        }
        if(!st.empty())
            return false;
        else
            return true;
    }
};

力扣链接:复杂链表的复制

这道题如果有了map的话,简直是太简单了。直接建立一个映射关系,然后先复制好每一个结点,然后利用[]运算符重载就可以很好的处理好每一个之间的关系。

/*
// Definition for a Node.
class Node {
public:
    int val;
    Node* next;
    Node* random;
    Node(int _val) {
        val = _val;
        next = NULL;
        random = NULL;
    }
};
*/
class Solution {
public:
    Node* copyRandomList(Node* head) {
        Node* cur = head;
        map<Node*,Node*> listMap;
        while(cur)
        {
            listMap[cur] = new Node(cur->val);
            cur = cur->next;
        }
        cur = head;
        while(cur)
        {
            listMap[cur]->next = listMap[cur->next];
            listMap[cur]->random = listMap[cur->random];
            cur = cur->next;
        }
        return listMap[head];
    }
};

5. multimap容器

这个容器与map之间的关系就好像set与multiset之间的关系一样。接口都是一样的,不同的就是这个容器允许重复元素出现

还有一共不同就是这个容器没有提供[]运算符重载了,其实也是比较合理的,因为此时一个key可以有很多个val,是没法确定要哪一个的。

insert也有一些变化,他的返回值就不在是一共pair了,里面就没有所谓的bool了,只是单纯的返回新插入结点的迭代器,因为他插入永远成功

那么既然一个key可以有多个val,我们可以注意到他是可以根据key进行删除的,那么它是全删除掉吗?确实是这样的,multimap根据一个值去删除元素会将所有与key相关的全部删除掉。

五、map和set相关力扣题

力扣链接:两个数组的交集

这道题目求的是交集,我们的思路就是利用set来完成最为方便。首先先将两个数组里面的值都丢到set里面,可以天然的去重。然后我们再去遍历这两个set。由于正好也排好序了。所以我们就如果谁小,谁就++,否则相等的话,那么就进入数组,然后两个同时++即可

class Solution {
public:
    vector<int> intersection(vector<int>& nums1, vector<int>& nums2) {
        set<int> s1(nums1.begin(),nums1.end());
        set<int> s2(nums2.begin(),nums2.end());
        vector<int> v;
        auto it1 = s1.begin();
        auto it2 = s2.begin();
        while(it1 != s1.end() && it2 != s2.end())
        {
            if(*it1>*it2)
            {
                it2++;
            }
            else if(*it1<*it2)
            {
                it1++;
            }
            else 
            {
                v.push_back(*it1);
                it1++;
                it2++;
            }
        }
        return v;
    }
};

如果题目要让我们求差集的话,也是很简单的,我们还是先丢到set里面,然后进行比对,将较小的进入数组,然后++。如果相等同时++即可。因为set天然的排好序了,所以,小的一定是独一无二的,而较大的,当小的++以后,可能就会出现重复了。

力扣链接:前K个高频单词

对于这道题,我们的思路也是比较简单的,我们首先先创建一个map,然后我们将words中的所有单词给放入map中,顺便统计好次数。这样以后,map中也正好天然的按照字典序排好了。接下来我们需要对map中的数据按照频率进行排序。不过这里的排序需要注意,我们不能直接对map进行排序,因为迭代器的类型不匹配。所以我们只能将数据都放入一个vector<pair<string,int>>中进行排序。在这里还有一个大坑,首先我们要按照降序排列,所以我们会写一个仿函数,让他按照降序排,其次这里我们不能直接用sort,因为sort底层是一个快排,它是不稳定的,会将字典序顺序打乱。所以我们需要使用一个稳定的排序,库里面正好提供了这个稳定的排序stable_sort。所以这下排序之后,我们就能完成这个题目了。

class Solution {
public:
    struct Greater
    {
        bool operator()(const pair<string,int>& p1,const pair<string,int>& p2)
        {
            return p1.second>p2.second;
        }
    };
    vector<string> topKFrequent(vector<string>& words, int k) {
        map<string,int> countMap;
        vector<string> v;
        for(auto& e : words)
        {
            countMap[e]++;
        }
        vector<pair<string,int>> vpa(countMap.begin(),countMap.end());
        stable_sort(vpa.begin(),vpa.end(),Greater()); 
        for(int i = 0; i < k; i++)
        {
            v.push_back(vpa[i].first);
        }
        return v;
    }
};

上面最坑人的地方莫过于sort不是稳定的排序,我们可能甚至都没用过stable_sort这个排序。那么在我们不知道的情况下,该如何处理这道题呢?事实上,我们会发现,我们的仿函数其实还可以在详细一些,我们先按频率排,当频率相等的时候,在依据字典序排列即可

class Solution {
public:
    struct Greater
    {
        bool operator()(const pair<string,int>& p1,const pair<string,int>& p2)
        {
            return p1.second>p2.second||((p1.second==p2.second)&&(p1.first<p2.first));
        }
    };
    vector<string> topKFrequent(vector<string>& words, int k) {
        map<string,int> countMap;
        vector<string> v;
        for(auto& e : words)
        {
            countMap[e]++;
        }
        vector<pair<string,int>> vpa(countMap.begin(),countMap.end());
        sort(vpa.begin(),vpa.end(),Greater()); 
        for(int i = 0; i < k; i++)
        {
            v.push_back(vpa[i].first);
        }
        return v;
    }
};

在这里其实还有第三种方式可以完成这道题

如下代码所示,我们可以先将countMap以字典序排好且统计出次数之后,然后使用一个multimap<int,string,greater<int>>以频率在排一次。注意使用第三个模板参数,即仿函数,因为我们是要以频率为降序进行排序。然后最后我们依次插入vector即可

class Solution {
public:
    vector<string> topKFrequent(vector<string>& words, int k) {
        map<string,int> countMap;
        vector<string> v;
        for(auto& e : words)
        {
            countMap[e]++;
        }
        multimap<int,string,greater<int>> sMap;
        for(auto& e : countMap)
        {
            sMap.insert(make_pair(e.second,e.first));
        }
        auto it = sMap.begin();
        while(k--)
        {
            v.push_back(it->second);
            it++;
        }
        return v;
    }
};

总结

本节主要讲解了map与set的基本使用。希望能对大家带来帮助!

相关文章
|
3天前
|
存储 JavaScript 索引
js开发:请解释什么是ES6的Map和Set,以及它们与普通对象和数组的区别。
ES6引入了Map和Set数据结构。Map的键可以是任意类型且有序,与对象的字符串或符号键不同;Set存储唯一值,无重复。两者皆可迭代,支持for...of循环。Map有get、set、has、delete等方法,Set有add、delete、has方法。示例展示了Map和Set的基本操作。
17 3
|
1月前
|
存储 自然语言处理 C++
map和set的简单介绍
map和set的简单介绍
20 1
|
4天前
|
存储 搜索推荐 C++
【C++高阶(二)】熟悉STL中的map和set --了解KV模型和pair结构
【C++高阶(二)】熟悉STL中的map和set --了解KV模型和pair结构
|
23天前
|
存储 JavaScript 前端开发
set和map的区别
set和map的区别
32 4
|
1月前
|
存储 算法 C语言
【C++入门到精通】C++入门 —— map & multimap (STL)
之前我们学习了C++的基础和一些概念,现在将探讨重要的STL组件——map与multimap。map是关联容器,提供有序键值对存储,基于红黑树,支持高效查找、插入和删除。每个键唯一对应一个值。multimap则允许键的重复。两者都提供迭代器支持,但map的键是唯一的,而multimap允许键重复,插入和查找效率不同。更多详情,请查阅官方文档。祝学习愉快!
12 0
|
1月前
|
存储 算法 C++
【C++ map结构 】std::map 和 std::unordered_map 在使用上的差异
【C++ map结构 】std::map 和 std::unordered_map 在使用上的差异
22 0
|
1月前
|
存储 编译器 容器
用红黑树封装实现map和set
用红黑树封装实现map和set
14 0
|
1月前
|
存储 算法 C++
【C++ 包装器类 map】C++ 标准库(std)中的map结构 哈希表(unordered_map)和黑红树(map)教程
【C++ 包装器类 map】C++ 标准库(std)中的map结构 哈希表(unordered_map)和黑红树(map)教程
85 1
|
1月前
|
存储 JSON C++
【C++】容器篇(五)—— map和set的基本介绍
【C++】容器篇(五)—— map和set的基本介绍
|
5天前
|
存储 编译器 C语言
c++的学习之路:5、类和对象(1)
c++的学习之路:5、类和对象(1)
19 0