【C++】:set和map

简介: 【C++】:set和map

1. 关联式容器

在初阶阶段,我们已经接触过STL中的部分容器,比如:vector、list、deque、forward_list(C++11)等,这些容器统称为序列式容器,因为其底层为线性序列的数据结构里面存储的是元素本身。那什么是关联式容器?它与序列式容器有什么区别?

关联式容器也是用来存储数据的,与序列式容器不同的是,其里面存储的是<key, value>结构的键值对,在数据检索时比序列式容器效率更高。

2. 键值对

用来表示具有一一对应关系的一种结构,该结构中一般只包含两个成员变量key和value,key代表键值,value表示与key对应的信息。比如:现在要建立一个英汉互译的字典,那该字典中必然有英文单词与其对应的中文含义,而且,英文单词与其中文含义是一一对应的关系,即通过该应该单词,在词典中就可以找到与其对应的中文含义。

SGI-STL中关于键值对的定义:

template <class T1, class T2>
struct pair
{
  typedef T1 first_type;
  typedef T2 second_type;
  T1 first;
  T2 second;
  pair() 
    : first(T1()), second(T2())
  {}
  pair(const T1& a, const T2& b) 
    : first(a), second(b)
  {}
};

3. set

根据应用场景的不桶,STL总共实现了两种不同结构的管理式容器:树型结构与哈希结构。树型结

构的关联式容器主要有四种:set、multiset、map、multismap。这四种容器的共同点是:使

用平衡搜索树(即红黑树)作为其底层结果,容器中的元素是一个有序的序列。下面一依次介绍每一个容器。

3.1 set的介绍

set文档介绍

  • 1. set是按照一定次序存储元素的容器
  • 2. 在set中,元素的value也标识它(value就是key,类型为T),并且每个value必须是唯一的set中的元素不能在容器中修改(元素总是const),但是可以从容器中插入或删除它们。
  • 3. 在内部,set中的元素总是按照其内部比较对象(类型比较)所指示的特定严格弱排序准则进行排序。
  • 4. set容器通过key访问单个元素的速度通常比unordered_set容器慢,但它们允许根据顺序对子集进行直接迭代。
  • 5. set在底层是用二叉搜索树(红黑树)实现的。

简而言之,set是一个key模型的容器,插入只需要插入key即可。

3.2 set的使用

3.2.1 set的模板参数列表

T: set中存放元素的类型,实际在底层存储<value, value>的键值对。

Compare:set中元素默认按照小于来比较。

Alloc:set中元素空间的管理方式,使用STL提供的空间配置器管理

3.2.2 set的构造
函数声明 功能介绍
set (const Compare& comp = Compare(), const Allocator&
= Allocator() );
构造空的set
set (InputIterator first, InputIterator last, const
Compare& comp = Compare(), const Allocator& =
Allocator() );
用[first, last)区
间中的元素构造
set
set ( const set<Key,Compare,Allocator>& x); set的拷贝构造
3.2.3 set的迭代器
函数声明 功能介绍
iterator begin() 返回set中起始位置元素的迭代器
iterator end() 返回set中最后一个元素后面的迭代器
const_iterator cbegin()
const
返回set中起始位置元素的const迭代器
const_iterator cend() const 返回set中最后一个元素后面的const迭代器
reverse_iterator rbegin() 返回set第一个元素的反向迭代器,即end
reverse_iterator rend() 返回set最后一个元素下一个位置的反向迭代器,
即rbegin
const_reverse_iterator
crbegin() const
返回set第一个元素的反向const迭代器,即cend
const_reverse_iterator
crend() const
返回set最后一个元素下一个位置的反向const迭
代器,即crbegin
3.2.4 set的容量
函数声明 功能介绍
bool empty ( ) const 检测set是否为空,空返回true,否则返回true
size_type size() const 返回set中有效元素的个数
3.2.5 set的修改操作
函数声明 功能介绍
pair<iterator,bool> insert (
const value_type& x )
在set中插入元素x,实际插入的是<x, x>构成的
键值对,如果插入成功,返回<该元素在set中的
位置,true>,如果插入失败,说明x在set中已经
存在,返回<x在set中的位置,false>
void erase ( iterator position ) 删除set中position位置上的元素
size_type erase ( const
key_type& x )
删除set中值为x的元素,返回删除的元素的个数
void erase ( iterator first,
iterator last )
删除set中[first, last)区间中的元素
void swap (
set<Key,Compare,Allocator>&
st );
交换set中的元素
void clear ( ) 将set中的元素清空
iterator find ( const
key_type& x ) const
返回set中值为x的元素的位置
size_type count ( const
key_type& x ) const
返回set中值为x的元素的个数

set是类似于搜索二叉树的一个树形结构容器,它是不支持对里面的数据进行修改的,并且在插入节点的时候如果set原本就存在和这个一样的数据,也是不能插入的,所以set中的insert返回值是一个pair,pair的first是一个迭代器,表示指向插入的位置,pair中的second是一个bool值,表示是否插入成功。

void Test_set1()
{
  //排序+去重
  set<int> s;
  s.insert(5);
  s.insert(2);
  s.insert(6);
  s.insert(1);
  s.insert(1);
  s.insert(2);
  //pair<set<int>::iterator, bool> ret1 = s.insert(5);
  auto ret1 = s.insert(5);
  cout << ret1.second << endl;
  //删除存在的元素
  s.erase(5);
  for (auto& e : s)
  {
    cout << e << " ";
  }
  cout << endl;
  //找到了返回该元素的迭代器,否则返回end的位置
  set<int>::iterator it = s.find(2);
  if (it != s.end())
  {
    s.erase(it);
  }
  for (auto& e : s)
  {
    cout << e << " ";
  }
  cout << endl;
  //查看一个元素在不在
  if (s.count(3))
  {
    cout << "3在" << endl;
  }
  else
  {
    cout << "3不在" << endl;
  }
}
3.2.6 其他接口
函数声明 功能介绍

iterator lower_bound (const value_type& val) const

返回大于等于val值位置的iterator
iterator upper_bound(const value_type& val) const 返回大于val值位置的iterator
pair<iterator, iterator> const value_type& val) const 返回等于val值的迭代器区间
void test_set2()
{
  set<int> myset;
  set<int>::iterator itlow, itup;
  for (int i = 1; i < 10; i++)
  {
    myset.insert(i * 10); // 10 20 30 40 50 60 70 80 90
  }
  itlow = myset.lower_bound(30);                // >= val值位置的iterator
  itup = myset.upper_bound(60);                 // >  val值位置的iterator
  myset.erase(itlow, itup);                     // 10 20 70 80 90
  for (auto e : myset)
  {
    cout << e << " ";
  }
  cout << endl;
}
void test_set3()
{
  set<int> myset;
  for (int i = 1; i <= 5; i++)
  {
    myset.insert(i * 10);   // myset: 10 20 30 40 50
  }
  //pair<set<int>::const_iterator, set<int>::const_iterator> ret;
  auto ret = myset.equal_range(30);
  cout << "the lower bound points to: " << *ret.first << '\n';   // >= val
  cout << "the upper bound points to: " << *ret.second << '\n';  // > val
}

注意:

  • 1. 与map/multimap不同,map/multimap中存储的是真正的键值对<key, value>,set中只放value,但在底层实际存放的是由<value, value>构成的键值对。
  • 2. set中插入元素时,只需要插入value即可,不需要构造键值对。
  • 3. set中的元素不可以重复(因此可以使用set进行去重)。
  • 4. 使用set的迭代器遍历set中的元素,可以得到有序序列
  • 5. set中的元素默认按照小于来比较
  • 6. set中查找某个元素,时间复杂度为:
  • 7. set中的元素不允许修改
  • 8. set中的底层使用二叉搜索树(红黑树)来实现。

3.3 multiset的介绍

multiset文档介绍

  • 1. multiset是按照特定顺序存储元素的容器,其中元素是可以重复的。
  • 2. 在multiset中,元素的value也会识别它(因为multiset中本身存储的就是<value, value>组成的键值对,因此value本身就是key,key就是value,类型为T). multiset元素的值不能在容器中进行修改(因为元素总是const的),但可以从容器中插入或删除。
  • 3. 在内部,multiset中的元素总是按照其内部比较规则(类型比较)所指示的特定严格弱排序准则进行排序。
  • 4. multiset容器通过key访问单个元素的速度通常比unordered_multiset容器慢,但当使用迭代器遍历时会得到一个有序序列。
  • 5. multiset底层结构为二叉搜索树(红黑树)。

注意:

  • 1. multiset中再底层中存储的是<value, value>的键值对
  • 2. mtltiset的插入接口中只需要插入即可
  • 3. 与set的区别是,multiset中的元素可以重复,set是中value是唯一的
  • 4. 使用迭代器对multiset中的元素进行遍历,可以得到有序的序列
  • 5. multiset中的元素不能修改
  • 6. 在multiset中找某个元素,时间复杂度为:
  • 7. multiset的作用:可以对元素进行排序

3.4 multiset的使用

multiset的使用接口与set的使用接口是一样的,只不过multiset可以允许存储在里面的数据重复,那么相比于set这里的equal_range就有很大的用处了:

void test_multiset()
{
  typedef multiset<int>::iterator It;
  int arr[] = { 10,20,50,30,40,60,30,30 };
  multiset<int> s;
  for (auto e : arr)
  {
    s.insert(e);
  }
  for (auto e : s)
  {
    cout << e << " ";  //10 20 30 30 30 40 50 60
  }
  cout << endl;
  std::pair<It, It> ret = s.equal_range(30);  //找到等于val值的区间
  s.erase(ret.first, ret.second);  //删除
  for (auto e : s)
  {
    cout << e << " ";     // 10 20 40 50 60
  }
  cout << endl;
}

还需要注意的是multiset中的find,如果有多个相同的值,返回的是第一个中序遍历得到的val的迭代器

4. map

4.1 map的介绍

map的文档介绍

  • 1. map是关联容器,它按照特定的次序(按照key来比较)存储由键值key和值value组合而成的元素。
  • 2. 在map中,键值key通常用于排序和唯一地标识元素,而值value中存储与此键值key关联的内容。键值key和值value的类型可能不同,并且在map的内部,key与value通过成员类型value_type绑定在一起,为其取别名称为pair:typedef pair<const key, T> value_type。
  • 3. 在内部,map中的元素总是按照键值key进行比较排序的。
  • 4. map中通过键值访问单个元素的速度通常比unordered_map容器慢,但map允许根据顺序对元素进行直接迭代(即对map中的元素进行迭代时,可以得到一个有序的序列)。
  • *5. map支持下标访问符,即在[]中放入key,就可以找到与key对应的value。
  • 6. map通常被实现为二叉搜索树(更准确的说:平衡二叉搜索树(红黑树))。

4.2 map的使用

4.2.1 map的模板参数列表

  • key: 键值对中key的类型
  • T: 键值对中value的类型
  • Compare: 比较器的类型,map中的元素是按照key来比较的,缺省情况下按照小于来比较,一般情况下(内置类型元素)该参数不需要传递,如果无法比较时(自定义类型),需要用户自己显式传递比较规则(一般情况下按照函数指针或者仿函数来传递)
  • Alloc:通过空间配置器来申请底层空间,不需要用户传递,除非用户不想使用标准库提供的空间配置器

注意:在使用map时,需要包含头文件。

4.2.2 map的构造
函数声明 功能介绍
map() 构造一个空的map
map (InputIterator first, InputIterator last, const
Compare& comp = Compare(), const Allocator& =
Allocator() );
使用迭代器区间初始化
map(const map& x) 拷贝构造
4.2.3 map的迭代器
函数声明 功能介绍
begin()和end() begin:首元素的位置,end最后一个元素的下一个位置
cbegin()和cend() 与begin和end意义相同,但cbegin和cend所指向的元素不
能修改
rbegin()和rend() 反向迭代器,rbegin在end位置,rend在begin位置,其
++和--操作与begin和end操作移动相反
crbegin()和crend() 与rbegin和rend位置相同,操作相同,但crbegin和crend所
指向的元素不能修改
4.2.4 map的容量
函数声明 功能简介
bool empty ( ) const 检测map中的元素是否为空,是返回
true,否则返回false
size_type size() const 返回map中有效元素的个数
4.2.5 map的元素修改
函数声明 功能简介
pair<iterator,bool> insert (
const value_type& x )
在map中插入键值对x,注意x是一个键值
对,返回值也是键值对:iterator代表新插入
元素的位置,bool代表释放插入成功
void erase ( iterator position ) 删除position位置上的元素
size_type erase ( const
key_type& x )
删除键值为x的元素
void erase ( iterator first,
iterator last )
删除[first, last)区间中的元素
void swap (
map<Key,T,Compare,Allocator>&
mp )
交换两个map中的元素
void clear ( ) 将map中的元素清空
iterator find ( const key_type& x
)
在map中查找key为x的元素,找到返回该元
素的位置的迭代器,否则返回end
const_iterator find ( const
key_type& x ) const
在map中查找key为x的元素,找到返回该元
素的位置的const迭代器,否则返回cend
size_type count ( const
key_type& x ) const
返回key为x的键值在map中的个数,注意
map中key是唯一的,因此该函数的返回值
要么为0,要么为1,因此也可以用该函数来
检测一个key是否在map中
void test_map1()
{
  map<string, string> dirt;
  dirt.insert(std::pair<string, string>("insert", "插入"));
  dirt.insert(std::pair<string, string>("erase", "删除"));
  dirt.insert(std::pair<string, string>("find", "查找"));
  dirt.insert(std::pair<string, string>("modify", "修改"));
  dirt.insert(make_pair("left", "左边"));
  dirt.insert(make_pair("right", "右边"));
  for (auto& e : dirt)
  {
    cout << e.first << ":" << e.second << endl;
  }
  cout << "------------" << endl;
  auto it = dirt.find("find");
  if (it != dirt.end())
  {
    dirt.erase(it);
  }
  for (auto& e : dirt)
  {
    cout << e.first << ":" << e.second << endl;
  }
}

这里再插入的时候可以使用pair实例化传参,也可以使用make_pair进行模板匹配传参,两者都可以,更推荐后者:

4.2.6 map元素的访问
函数声明
mapped_type& operator[] (const
key_type& k)
返回去key对应的value

我们来重点了解一下operator[]的使用:

key_type就是在构造map时传递的第一个参数key,这个值是不允许修改的。

mapped_type是与key对应的value,这个值是可以允许修改的。

operator[]返回的是key对应的val,那么这个返回的过程我们可以来具体的了解一下:

可以看到operator[]与insert也有一定的关系,所以我们来结合insert来一起研究一下:

insert的返回值是一个pair,插入成功和插入失败分别对应不同的迭代器,那么在使用operator[]时肯定会有插入的成分,所以在使用时要传递一个key类型的对象,然后先进行插入,插入成功返回key对应的val,插入失败返回已有的key对应的val,那么现在再来拆分一下它如何返回的。

了解到这里,我们就可以通过operator[]接口来实现一些有用的操作了,它的作用十分广泛,接下来让我们一一了解:

比如,要统计一个数组中各各元素出现的次数

先来演示普通的写法:使用map来进行统计,先遍历这个数组,如果该元素在map中已有存储,那么只需要将它的second++进行计数即可,如果map中没有这个元素,那么将该元素进行插入,并将它的value设置为1即可。

void test_map2()
{
  //统计次数
  string arr[] = { "苹果", "西瓜", "苹果", "西瓜", "苹果", "苹果", "西瓜", "苹果", "香蕉", "苹果", "香蕉" };
  map<string, int> countMap;
  //普通写法
  for (auto str : arr)
  {
    //遍历string然后在map中进行查找
    auto ret = countMap.find(str);
    if (ret != countMap.end())
    {
      ret->second++;  //存在将value++
    }
    else
    {
      countMap.insert(make_pair(str,1));  //不存在进行插入然后将value置为1
    }
  }
  for (auto& kv : countMap)
  {
    cout << kv.first << ":" << kv.second << endl;
  }
}

再来看看使用operator[]进行统计:

void test_map2()
{
  //统计次数
  string arr[] = { "苹果", "西瓜", "苹果", "西瓜", "苹果", "苹果", "西瓜", "苹果", "香蕉", "苹果", "香蕉" };
  map<string, int> countMap;
  //使用operator[]
  for (auto str : arr) //遍历string,依次使用[]进行统计
  {
    countMap[str]++; //返回的是value的值,对其++即可完成计数
  }
  for (auto& kv : countMap)
  {
    cout << kv.first << ":" << kv.second << endl;
  }
}

使用operator[]可以看到代码简单了不少,那么来简单的分析一下是怎么实现的,首先operator[]返回的是key对应的value,那么在这个场景中,如果我们传递的是“苹果”,那么首先会使用insert对“苹果”插入,如果之前就存在“苹果”,那么insert对应的返回值就是已经存在的“苹果”的位置,然后将它对应的value返回,如果不存在,进行插入,并且返回新插入的位置,然后将它对应的value返回,那么在这里再使用++即可完成对次数的统计。

operator[]用处很多,我们可以来用一下:

void test_map3()
{
  map<string, string> dirt;
  dirt.insert(make_pair("left", "左"));  //插入
  cout << dirt["left"] << endl; // 查找
  dirt["right"] = "右";      //插入+修改
  dirt["left"] = "混合";        //修改
  dirt["test"];        //插入
}

总结:

  • 1. map中的的元素是键值对
  • 2. map中的key是唯一的,并且不能修改
  • 3. 默认按照小于的方式对key进行比较
  • 4. map中的元素如果用迭代器去遍历,可以得到一个有序的序列
  • 5. map的底层为平衡搜索树(红黑树),查找效率比较高
  • 6. 支持[]操作符,operator[]中实际进行插入查找。

4.3 multimap的介绍

multimap的文档介绍

  • 1. Multimaps是关联式容器,它按照特定的顺序,存储由key和value映射成的键值对<key,value>,其中多个键值对之间的key是可以重复的。
  • 2. 在multimap中,通常按照key排序和惟一地标识元素,而映射的value存储与key关联的内容。key和value的类型可能不同,通过multimap内部的成员类型value_type组合在一起,value_type是组合key和value的键值对:typedef pair<const Key, T> value_type;
  • 3. 在内部,multimap中的元素总是通过其内部比较对象,按照指定的特定严格弱排序标准对key进行排序的。
  • 4. multimap通过key访问单个元素的速度通常比unordered_multimap容器慢,但是使用迭代器直接遍历multimap中的元素可以得到关于key有序的序列。
  • 5. multimap在底层用二叉搜索树(红黑树)来实现。

注意:multimap和map的唯一不同就是:map中的key是唯一的,而multimap中key是可以
重复的。

multimap中的接口可以参考map,功能都是类似的。

注意:

  • 1. multimap中的key是可以重复的。
  • 2. multimap中的元素默认将key按照小于来比较
  • 3. multimap中没有重载operator[]操作(因为multimap是可以允许key重复的,如果存在operator[],那么会造成数据的不清晰,影响访问)
  • 4. 使用时与map包含的头文件相同

 

朋友们、伙计们,美好的时光总是短暂的,我们本期的的分享就到此结束,欲知后事如何,请听下回分解~,最后看完别忘了留下你们弥足珍贵的三连喔,感谢大家的支持!    

目录
相关文章
|
29天前
|
算法
你对Collection中Set、List、Map理解?
你对Collection中Set、List、Map理解?
60 18
你对Collection中Set、List、Map理解?
|
22天前
|
存储 缓存 安全
只会“有序无序”?面试官嫌弃的List、Set、Map回答!
小米,一位热衷于技术分享的程序员,通过与朋友小林的对话,详细解析了Java面试中常见的List、Set、Map三者之间的区别,不仅涵盖了它们的基本特性,还深入探讨了各自的实现原理及应用场景,帮助面试者更好地准备相关问题。
55 20
|
2月前
|
存储 C++ 容器
【C++】map、set基本用法
本文介绍了C++ STL中的`map`和`set`两种关联容器。`map`用于存储键值对,每个键唯一;而`set`存储唯一元素,不包含值。两者均基于红黑树实现,支持高效的查找、插入和删除操作。文中详细列举了它们的构造方法、迭代器、容量检查、元素修改等常用接口,并简要对比了`map`与`set`的主要差异。此外,还介绍了允许重复元素的`multiset`和`multimap`。
35 3
【C++】map、set基本用法
|
2月前
|
存储 算法 C++
【C++】unordered_map(set)
C++中的`unordered`容器(如`std::unordered_set`、`std::unordered_map`)基于哈希表实现,提供高效的查找、插入和删除操作。哈希表通过哈希函数将元素映射到特定的“桶”中,每个桶可存储一个或多个元素,以处理哈希冲突。主要组成部分包括哈希表、哈希函数、冲突处理机制、负载因子和再散列,以及迭代器。哈希函数用于计算元素的哈希值,冲突通过开链法解决,负载因子控制哈希表的扩展。迭代器支持遍历容器中的元素。`unordered_map`和`unordered_set`的插入、查找和删除操作在理想情况下时间复杂度为O(1),但在冲突较多时可能退化为O(n)。
26 5
|
2月前
|
存储 C++ 容器
【C++】map的模拟实现
C++中的`map`是STL中的一种关联容器,存储键值对且键唯一。`map`基于红黑树实现,自动按键排序,支持动态调整、复杂数据类型、丰富的成员函数及双向迭代器。插入、查找等操作保证了对数时间复杂度,适用于需要快速查找和有序存储的场景。
24 3
|
2月前
|
存储 C++ 容器
【C++】set模拟实现
C++中的`set`是STL提供的一种关联容器,用于存储唯一元素并自动按特定顺序(默认升序)排序。其内部通过红黑树实现,保证了高效的插入、删除和查找操作,时间复杂度均为O(log n)。`set`支持迭代器遍历,提供了良好的数据访问接口。
43 3
|
3月前
|
存储 JavaScript 前端开发
Set、Map、WeakSet 和 WeakMap 的区别
在 JavaScript 中,Set 和 Map 用于存储唯一值和键值对,支持多种操作方法,如添加、删除和检查元素。WeakSet 和 WeakMap 则存储弱引用的对象,有助于防止内存泄漏,适合特定场景使用。
|
4月前
|
存储 Java API
【数据结构】map&set详解
本文详细介绍了Java集合框架中的Set系列和Map系列集合。Set系列包括HashSet(哈希表实现,无序且元素唯一)、LinkedHashSet(保持插入顺序的HashSet)、TreeSet(红黑树实现,自动排序)。Map系列为双列集合,键值一一对应,键不可重复,值可重复。文章还介绍了HashMap、LinkedHashMap、TreeMap的具体实现与应用场景,并提供了面试题示例,如随机链表复制、宝石与石头、前K个高频单词等问题的解决方案。
52 6
【数据结构】map&set详解
|
3月前
|
存储 缓存 Java
【用Java学习数据结构系列】HashMap与TreeMap的区别,以及Map与Set的关系
【用Java学习数据结构系列】HashMap与TreeMap的区别,以及Map与Set的关系
47 1
|
4月前
|
算法
你对Collection中Set、List、Map理解?
你对Collection中Set、List、Map理解?
44 5