【JavaDS】集合Map和Set及其相关实现类

简介: 【JavaDS】集合Map和Set及其相关实现类

一. Map和Set的概述

Map和Set是一种专门用来进行搜索的容器或者数据结构,其搜索的效率与其具体的实例化子类有关。

以前常见的搜索方式有:

直接遍历,时间复杂度为O(N),元素如果比较多效率会非常慢

二分查找,时间复杂度为O(logN) ,但搜索前必须要求序列是有序的

上述排序比较适合静态类型的查找,即一般不会对区间进行插入和删除操作了,而现实中的查找比如:

根据姓名查询考试成绩

通讯录,即根据姓名查询联系方式

不重复集合,即需要先搜索关键字是否已经在集合中

可能在查找时进行一些插入和删除的操作,即动态查找,那上述两种方式就不太适合了,这里介绍的Map和Set是一种适合动态查找的集合容器。

两种模型 :


一般把搜索的数据称为关键字(Key),和关键字对应的称为值(Value),将其称之为Key-value的键值对,所以模型会有两种:


纯 key 模型(Set就是一个纯key模型),比如 :

有一个英文词典,快速查找一个单词是否在词典中。

快速查找某个名字在不在通讯录中。

Key-Value 模型(Map就是一个key-val模型),比如 :

统计文件中每个单词出现的次数,统计结果是每个单词都有与其对应的次数:<单词,单词出现的次数>。

梁山好汉的江湖绰号:每个好汉都有自己的江湖绰号。

73d8c9be8b2a4960a39693770de0ac9a.png

73d8c9be8b2a4960a39693770de0ac9a.png

二. Map

Map没有继承自Collection/Iterable接口,所以Map不能使用迭代器去遍历, 实现该接口的实现类中存储的是<K,V>结构的键值对,并且K一定是唯一的,不能重复

1. 注意事项

Map是一个接口,不能直接实例化对象,如果要实例化对象只能实例化其实现类TreeMap或者HashMap

Map中存放键值对的Key是唯一的,value是可以重复的

Map中的Key可以全部分离出来,存储到Set中来进行访问(因为Key不能重复)。

Map中的value可以全部分离出来,存储在Collection的任何一个子集合中(value可能有重复)。

Map中键值对的Key不能直接修改,value可以修改,如果要修改key,只能先将该key删除掉,然后再来进行重新插入。

2. 关于Map.Entry<K,V>的说明

Map.Entry<K,V>是Map内部实现的用来存放键值对映射关系的内部类,该内部类中主要提供了<key, value>的获取,value的设置以及Key的比较方式 :

方法 解释
K getKey(); 返回 entry 中的 key
V getValue(); 返回 entry 中的 value
V setValue(V value); 将键值对中的value替换为指定value

注意:Map.Entry并没有提供设置Key的方法

3. Map接口中常用方法

方法 解释
int size(); 获取map中键值对个数
boolean isEmpty(); 判断map是否为空表
boolean containsKey(Object key); 判断map中是否包含关键字key
boolean containsValue(Object value); 判断map中是否包含值value
V get(Object key); 根据关键字key获取value
V put(K key, V value); 增加键值对<key, value>,如果已经存在则更新value值
V remove(Object key); 根据关键字key删除键值对
void putAll(Map<? extends K, ? extends V> m); 根据传入的map插入键值对
void clear(); 清空map
Set keySet(); 获取map中所有的key并放入set集合中
Collection values(); 获取map中所有的value,并放入collection集合中,可重复
Set<Map.Entry<K, V>> entrySet(); 将map中所有的键值对以Map.Entry<K,V>类型打包到set中
default V getOrDefault(Object key, V defaultValue) 返回 key 对应的 value,key 不存在,返回默认值
default V replace(K key, V value) 修改key关键字对应的value
default boolean replace(K key, V oldValue, V newValue) 将关键字对应的oldValue修改为newValue

通过下面的代码区分get()和 getOrDefault()两个方法的细节

73d8c9be8b2a4960a39693770de0ac9a.png

73d8c9be8b2a4960a39693770de0ac9a.png

当我们通过get 获取的是Integer类型的值,让他赋值给整形会发生拆包,这里map中没有key,那么会返回null,此时拆包,就会发生空指针异常;

而使用 getOrDefault() , 如果map中没有key , 就会返回我们设置的默认值, 就不会进行拆包操作了 .

4. HashMap和TreeMap

HashMap与TreeMap都实现了Map接口, 两者的区别如下:

Map底层结构 TreeMap HashMap
底层结构 红黑树 哈希桶(表)
插入/删除/查找时间复杂度 O(log2N) O(1)
是否有序 关于Key有序 (因为实现了SortedMap接口) 无序 (哈希表是散列表)
线程安全 不安全 不安全
插入/删除/查找区别 需要进行元素比较 通过哈希函数计算哈希地址
比较与覆写 key必须能够比较,否则会抛出ClassCastException异常 自定义类型需要覆写equals和 hashCode方法
应用场景 需要Key有序场景下 Key是否有序不关心,需要更高的时间性能

TreeMap继承关系图如下:73d8c9be8b2a4960a39693770de0ac9a.png

TreeMap构造方法 解释
public TreeMap() 无参构造
public TreeMap(Comparator<? super K> comparator) 传入比较器,能够控制Mapk的key的排序
public TreeMap(Map<? extends K, ? extends V> m) 根据传入的map对象来构造新的Treemap对象
public TreeMap(SortedMap<K, ? extends V> m) 根据传入的SortedMap对象构造新的Treemap对象

HashMap继承关系图如下:

73d8c9be8b2a4960a39693770de0ac9a.png

HashMap构造方法 解释
public HashMap() 无参构造
public HashMap(int initialCapacity, float loadFactor) 指定容量(必须是二的幂)和负载因子构造对象
public HashMap(int initialCapacity) 指定容量(必须是二的幂)构造对象
public HashMap(Map<? extends K, ? extends V> m) 根据map对象构造新HashMap对象

5. 遍历Map

Map当中没有实现Iterable接口, 所以遍历map的思路是将Map放到实现Iterable接口中的Set中即可;

  • 通过keySet()方法
public static void main(String[] args) {
    Map<String,Integer> map = new HashMap<>();
    map.put("张三",1);
    map.put("李四",2);
    map.put("王五",3);
    Set<String> set = map.keySet();
    for (String s : set) {
        System.out.println(s+" = "+map.get(s));
    }
}
  • 通过entrySet()方法
public static void main(String[] args) {
    Map<String,Integer> map = new HashMap<>();
    map.put("张三",1);
    map.put("李四",2);
    map.put("王五",3);
    Set<Map.Entry<String, Integer>> entries = map.entrySet();
    for (Map.Entry<String, Integer> entry : entries) {
        System.out.println(entry.getKey()+" = "+entry.getValue());
    }
}
  • 通过Map提供的forEach(BiConsumer)方法

BiConsumer是一个函数式接口,接受两个输入参数

public static void main(String[] args) {
    Map<String,Integer> map = new HashMap<>();
    map.put("张三",1);
    map.put("李四",2);
    map.put("王五",3);
    map.forEach(new BiConsumer<String, Integer>() {
        @Override
        public void accept(String key, Integer value) {
            System.out.println(key+" = "+value);
        }
    });
}

三. Set

1. 注意事项

Set是继承自Collection的一个接口类

Set中只存储了key,并且要求key一定要唯一

Set的底层是使用Map来实现的,其使用key与Object的一个默认对象作为键值对插入到Map中的

Set最大的功能就是对集合中的元素进行去重

实现Set接口的常用类有TreeSet和HashSet,还有一个LinkedHashSet,LinkedHashSet是在HashSet的基础上维护了一个双向链表来记录元素的插入次序。

Set中的Key不能修改,如果要修改,先将原来的删除掉,然后再重新插入

2. Set接口中常用方法

Set接口中大部分方法都是从Collection接口中扩展的,常用方法如下:

方法 解释
int size(); 获取集合中元素的个数
boolean isEmpty(); 判断集合是否为空表
boolean contains(Object o); 判断set是否包含对象o
Iterator iterator(); 获取集合迭代器
Object[] toArray(); 将set转换成Object数组
T[] toArray(T[] a); 将set转换为数组
boolean add(E e); 增加元素e
boolean remove(Object o); 删除元素o
boolean containsAll(Collection<?> c); 判断set中是否含有collection对象中所有的元素
boolean addAll(Collection<? extends E> c); 插入c对象中所有的元素,可以去重
boolean retainAll(Collection<?> c); set中保留和两个集合的交集
boolean removeAll(Collection<?> c); 根据c对象元素对应删除set中的元素
void clear(); 清空set对象里面所有元素

3. TreeSet和HashSet

HashSet与TreeSet都实现了Set接口, 两者的区别如下:

Set底层结构 TreeSet HashSet
底层结构 红黑树 哈希桶(表)
插入/删除/查找时间复杂度 O(log2N) O(1)
是否有序 关于Key有序 (因为实现了SortedSet接口) 无序 (哈希表是散列表)
线程安全 不安全 不安全
插入/删除/查找区别 按照红黑树的特性来进行插入和删除 1.先计算key哈希地址2.然后进行插入和删除
比较与覆写 key必须能够比较,否则会抛出ClassCastException异常 自定义类型需要覆写equals和 hashCode方法
应用场景 需要Key有序场景下 Key是否有序不关心,需要更高的时间性能

TreeSet继承关系图如下:

73d8c9be8b2a4960a39693770de0ac9a.png

TreeSet构造方法 解释
public TreeSet() 无参构造
public TreeSet(Comparator<? super E> comparator) 传入比较器,控制set的排序
public TreeSet(Collection<? extends E> c) 根据集合c的元素创建TreeSet
public TreeSet(SortedSet s) 根据SortedSet对象的元素创建TreeSet

HashSet继承关系图如下:

73d8c9be8b2a4960a39693770de0ac9a.png

HashSet构造方法 解释
public HashSet() 无参构造
public HashSet(Collection<? extends E> c) 根据集合对象c构造HashSet对象
public HashSet(int initialCapacity, float loadFactor) 指定容量(必须是二的幂)和负载因子构造HashSet对象
public HashSet(int initialCapacity) 指定容量(必须是二的幂)构造HashSet对象

4. 遍历Set

  • 通过迭代器遍历
public static void main(String[] args) {
    Set<Integer> set = new HashSet<>();
    set.add(1);
    set.add(2);
    set.add(3);
    Iterator<Integer> it = set.iterator();
    while(it.hasNext()) {
        System.out.print(it.next()+" ");
    }
}
  • foreach遍历
public static void main(String[] args) {
    Set<Integer> set = new HashSet<>();
    set.add(1);
    set.add(2);
    set.add(3);
    for (Integer integer : set) {
        System.out.print(integer+" ");
    }
}
  • 通过Iterable接口中的forEach(Consumer)方法

Consumer是一个函数式接口,接受一个输入参数

public static void main(String[] args) {
    Set<Integer> set = new HashSet<>();
    set.add(1);
    set.add(2);
    set.add(3);
    set.forEach(new Consumer<Integer>() {
        @Override
        public void accept(Integer key) {
            System.out.print(key+" ");
        }
    });
}

四. 小试牛刀

解决下面的三个问题:

  1. 统计10W个数据当中,不重复的数据?(去重)
  2. 统计10W个数据当中,第一个重复的数据?
  3. 统计10W个数据当中,每个数据出现的次数? (对应的关系)
import java.util.*;
public class Test {
    //1、统计10W个数据当中,不重复的数据?[去重]
    public static void func1(int[] array) {
        Set<Integer> set = new HashSet<>();
        for (int i = 0; i < array.length; i++) {
            set.add(array[i]);
        }
        System.out.println(set);
    }
    //2、统计10W个数据当中,第一个重复的数据?
    public static void func2(int[] array) {
        Set<Integer> set = new HashSet<>();
        for (int i = 0; i < array.length; i++) {
            if(!set.contains(array[i])) {
                set.add(array[i]);
            }else {
                System.out.println(array[i]);
                break;
            }
        }
    }
    //3、统计10W个数据当中,每个数据出现的次数? 对应的关系
    public static void func3(int[] array) {
        Map<Integer, Integer> map = new HashMap<>();
        for (int i = 0; i < array.length; i++) {
            int key = array[i];
            if(map.get(key) == null) {
                map.put(key, 1);
            }else {
                int val = map.get(key);
                map.put(key, val+1);
            }
        }
        for (Map.Entry<Integer, Integer> entry:map.entrySet()) {
            System.out.println("key: "+ entry.getKey()+"出现了: "+entry.getValue()+" 次");
        }
    }
    public static void main(String[] args) {
        int[] array = new int[10_0000];
        Random random = new Random();
        for (int i = 0; i < array.length; i++) {
            array[i] = random.nextInt(5_0000);
        }
        func1(array);
        func2(array);
        func3(array);
    }
}
目录
相关文章
|
5月前
|
存储 JavaScript Java
(Python基础)新时代语言!一起学习Python吧!(四):dict字典和set类型;切片类型、列表生成式;map和reduce迭代器;filter过滤函数、sorted排序函数;lambda函数
dict字典 Python内置了字典:dict的支持,dict全称dictionary,在其他语言中也称为map,使用键-值(key-value)存储,具有极快的查找速度。 我们可以通过声明JS对象一样的方式声明dict
351 1
|
8月前
|
存储 缓存 JavaScript
Set和Map有什么区别?
Set和Map有什么区别?
580 1
|
5月前
|
存储 算法 容器
set_map的实现+set/map加持秒杀高频算法题锻炼算法思维
`set`基于红黑树实现,支持有序存储、自动去重,增删查效率为O(logN)。通过仿函数可自定义排序规则,配合空间配置器灵活管理内存。不支持修改元素值,迭代器失效需注意。`multiset`允许重复元素。常用于去重、排序及查找场景。
|
9月前
|
存储 JavaScript 前端开发
for...of循环在遍历Set和Map时的注意事项有哪些?
for...of循环在遍历Set和Map时的注意事项有哪些?
423 121
|
12月前
|
编译器 C++ 容器
【c++丨STL】基于红黑树模拟实现set和map(附源码)
本文基于红黑树的实现,模拟了STL中的`set`和`map`容器。通过封装同一棵红黑树并进行适配修改,实现了两种容器的功能。主要步骤包括:1) 修改红黑树节点结构以支持不同数据类型;2) 使用仿函数适配键值比较逻辑;3) 实现双向迭代器支持遍历操作;4) 封装`insert`、`find`等接口,并为`map`实现`operator[]`。最终,通过测试代码验证了功能的正确性。此实现减少了代码冗余,展示了模板与仿函数的强大灵活性。
327 2
|
9月前
|
安全 Java 数据库连接
让我们讲解一下 Map 集合遍历的方式
我是小假 期待与你的下一次相遇 ~
333 43
|
9月前
|
存储 C++ 容器
unordered_set、unordered_multiset、unordered_map、unordered_multimap的介绍及使用
unordered_set是不按特定顺序存储键值的关联式容器,其允许通过键值快速的索引到对应的元素。在unordered_set中,元素的值同时也是唯一地标识它的key。在内部,unordered_set中的元素没有按照任何特定的顺序排序,为了能在常数范围内找到指定的key,unordered_set将相同哈希值的键值放在相同的桶中。unordered_set容器通过key访问单个元素要比set快,但它通常在遍历元素子集的范围迭代方面效率较低。它的迭代器至少是前向迭代器。前向迭代器的特性。
429 0
|
9月前
|
编译器 C++ 容器
用一棵红黑树同时封装出map和set
再完成上面的代码后,我们的底层代码已经完成了,这时候已经是一个底层STL的红黑树了,已经已符合库里面的要求了,这时候我们是需要给他穿上对应的“衣服”,比如穿上set的“衣服”,那么这个穿上set的“衣服”,那么他就符合库里面set的要求了,同样map一样,这时候我们就需要实现set与map了。因此,上层容器map需要向底层红黑树提供一个仿函数,用于获取T当中的键值Key,这样一来,当底层红黑树当中需要比较两个结点的键值时,就可以通过这个仿函数来获取T当中的键值了。我们就可以使用仿函数了。
133 0
|
9月前
|
存储 编译器 容器
set、map、multiset、multimap的介绍及使用以及区别,注意事项
set是按照一定次序存储元素的容器,使用set的迭代器遍历set中的元素,可以得到有序序列。set当中存储元素的value都是唯一的,不可以重复,因此可以使用set进行去重。set默认是升序的,但是其内部默认不是按照大于比较,而是按照小于比较。set中的元素不能被修改,因为set在底层是用二叉搜索树来实现的,若是对二叉搜索树当中某个结点的值进行了修改,那么这棵树将不再是二叉搜索树。
323 0