4. HashMap
4.1 HashMap的快速查找演示
- 采用ArrayList存储元素,查找元素过程
当采用ArrayList存储元素,进行查找元素时,需要从头到位进行遍历.比如要查找元素a,需要遍历整个ArrayList,然后进行匹配.
时间复杂度为O ( N )
当采用HashMap存储元素,查找元素过程
首先我们分析以下HashMap的存储过程.比如元素a,先利用hash算法(hashCode())计算出key对应的hash值,然后再进行二次hash(演示中的两次hash是一样的,实际中未必哦!),然后计算元素的下标: 97 % 16 = 1,最后就将元素存储在1位置.
如何进行元素的查找呢?
也是通过元素的hash值进行查找,比如我要查找a,那么a对应的下标经过计算可以得到是1,然后直接去下标为1的地方获取值即可.这个时候的时间复杂度就成了 O ( 1 )
但是如果遇到了hash冲突,则计算出下标后还需要进行多次匹配,直到匹配到指定的元素.
4.2 链表过长的解决方案
4.2.1 方案1—扩容
先说明一个问题,hashMap出现链表过长的原因是什么?这样会给我们带来的弊端是什么?
原因: 当元素数量增多,经过key计算出来的hash值更容易冲突(也就是hash值一致),从而会导致同一个下标下的链表长度会不断的增长.
弊端: 如果链表过长,就会大大降低查找元素的效率. 当我们通过hash算法计算得到下标后,还需要遍历链表来匹配元素,由LinkedList底层原理可知,链表迭代的效率是非常低的,从而导致查找元素的效率大大降低
这时候我们就需要提高元素查找效率了,第一种方案就是扩容,演示如下:
若下图,1,2,3,4和5,6,7,8 经过hash运算和下标计算得到的数组下标是一样的,都是1
当元素的个数> 容量 * 负载因子,也就是 > 12的时候,链表就会进行扩容,每次库容后的大小是之前的2倍.
此时5,6,7,8的下标就会变化,从而链表长度就会缩短.
备注: 但是对于一些特殊情况,比如扩容前链表中的元素的hash值是一样的,那么即使扩容后元素仍然还在同一条链表上,并无法达到缩短链表的效果. 如下图所示:
总结:扩容并不能完全解决链表过长的问题,因此就有了下面我们将要介绍的将链表转换为红黑树
4.2.1 方案2—树化
树化的前提条件
链表的长度必须达到阈值(8)
数组的长度必须大于64,否则会采取扩容的策略.
图解
当链表的长度超过8,但是数组长度==< 64==时.
当链表的长度超过8,但是数组长度==>= 64==时
分析
红黑树比较规则:先按照hash值比,如果相等,则按照字符值的大小顺序比.
树化后的比较:(以数字8为例)
比4大–>右子树查找–>比6大–>右子树寻找–>和8相同,查找结束. 总共需要3次比较,即可找到对应的数.
红黑树查找的时间复杂度:O ( l o g 2 N ) O(log2N)O(log2N)
补充:hashMap中的链表长度会大于8吗?
4.3 红黑树的意义—树化阈值
hash 值如果足够随机,则在 hash 表内按泊松分布,在负载因子 0.75 的情况下,长度超过 8 的链表出现概率是 0.00000006,树化阈值选择 8 就是为了让树化几率足够小
代码演示大量单词(234937个)加入到hashMap中后,链表的长度情况
package com.rg.map; import java.io.IOException; import java.lang.reflect.Array; import java.lang.reflect.Field; import java.nio.file.Files; import java.nio.file.Path; import java.util.HashMap; import java.util.Map; import java.util.concurrent.atomic.AtomicInteger; import java.util.stream.Collectors; // --add-opens java.base/java.util=ALL-UNNAMED public class HashMapDistribution { public static void main(String[] args) throws IOException { Object value = new Object(); Map<String, Object> words = Files.readAllLines(Path.of("words")).stream() .collect(Collectors.toMap(w -> w, w -> value)); System.out.println(words.getClass()); showDistribution(words); } private static void showDistribution(Map<String, Object> map) { try { Field tableField = HashMap.class.getDeclaredField("table"); Field nextField = Class.forName("java.util.HashMap$Node").getDeclaredField("next"); tableField.setAccessible(true); nextField.setAccessible(true); Object array = tableField.get(map); int length = Array.getLength(array); System.out.println("总的桶个数[" + length + "]"); Map<Integer, AtomicInteger> result = new HashMap<>(); for (int i = 0; i < length; i++) { Object node = Array.get(array, i); AtomicInteger c = result.computeIfAbsent(i, key -> new AtomicInteger()); while (node != null) { c.incrementAndGet(); node = nextField.get(node); } } Map.Entry maxEntry = null; int max = -1; HashMap<Integer, AtomicInteger> counting = new HashMap<>(); for (Map.Entry<Integer, AtomicInteger> entry : result.entrySet()) { int value = entry.getValue().get(); AtomicInteger c = counting.computeIfAbsent(value, k -> new AtomicInteger()); c.incrementAndGet(); } counting.forEach((k, v) -> { System.out.println(k + "个元素的桶个数[" + v + "]"); }); } catch (Exception e) { e.printStackTrace(); } } }
4.4 树退化链表
4.4.1 情况1—树节点个数<=6
情况1:在扩容时如果拆分树时,树元素个数 <= 6 则会退化链表
退化图解
- 当HashMap的链表中红黑树为6时,发生退化
- 当HashMap中的红黑树节点为7时,保持红黑树