HashMap中putMapEntries()方法源码详解

简介: HashMap中putMapEntries()方法源码详解

一、源码解读

在HashMap中,我们通常使用public void putAll()方法对传入的map集合进行批量插入

public void putAll(Map<? extends K, ? extends V> m) {
   
    putMapEntries(m, true);
}

该方法直接调用putMapEntries()方法,因此我们对其重点关注。

putMapEntries()方法是所有存放批量数据的核心方法。由于是存放批量数据,所以聪明的小伙伴可能会想到是遍历一个数据集合并对集合中的每一条数据调用putVal()方法进行存放。如果有不了解putVal()方法的小伙伴,可以参考前面的文章HashMap中put()方法源码解读 ,下面我们贴上源码来分析一下

final void putMapEntries(Map<? extends K, ? extends V> m, boolean evict) {
   
    // 获取集合大小,
    int s = m.size();
    if (s > 0) {
   
        // 如果底层数组尚未实例化,则需要计算出满足该数据量的数组长度和响应的阈值,避免在保存数据的时候频繁扩容
        if (table == null) {
    // pre-size
            float ft = ((float)s / loadFactor) + 1.0F;
            int t = ((ft < (float)MAXIMUM_CAPACITY) ?
                     (int)ft : MAXIMUM_CAPACITY);
            if (t > threshold)
                threshold = tableSizeFor(t);
        }
        // 如果底层数组已经实例化过了,且要保存的数据量大于扩容阈值,则进行扩容
        else if (s > threshold)
            resize();
        // 将参数map集合,转换为entry的set集合,并对每一个entry进行遍历,通过putVal()将每一个entry中的key和value保存到哈希表中
        for (Map.Entry<? extends K, ? extends V> e : m.entrySet()) {
   
            K key = e.getKey();
            V value = e.getValue();
            putVal(hash(key), key, value, false, evict);
        }
    }
}

这个方法其实没什么好说的,无非就是判断底层数组是否需要扩容,然后对map集合进行批量插入。但即使是批量插入,最终也是循环调用putVal()方法将集合数据逐个插入的。

其中有一行代码对于初次阅读源码的同学可能有所疑惑

final void putMapEntries(Map<? extends K, ? extends V> m, boolean evict) {
   
    // ...
    float ft = ((float)s / loadFactor) + 1.0F;
    // ...
}

((float)s / loadFactor) + 1.0F; 为什么要将 集合大小s 除以 加载因子loadFactor 的值 再加一 呢?

首先我们要知道执行这行代码的前提是底层数组为空,因此在批量插入后,集合大小就是当前hashMap对象的数据量了。还有一个就是HashMap的扩容机制是当数据量 = 底层数组长度 * 加载因子loadFactor 时,需要扩容。也就是说,当 数据量 / 加载因子loadFactor = 底层数组长度 时需要对其扩容。因此,如果我们把底层数组的初始长度设置为 数据量 / 加载因子loadFactor 时,其实就需要第二次扩容了,为了避免这第二次扩容,将其商值加一是非常不错的办法。

所以 集合大小s 除以 加载因子loadFactor 的值 再加一 就是为了在确定底层数组长度时一步到位,避免频繁扩容。同时也可以使底层数组的空间利用率最大化。


二、缺陷

说到这里,我发现putMapEntries()这个方法有个比较矛盾的地方,不知道大家注意到没有

else if (s > threshold)这个代码块中,如果结果为true,则执行一次resize()进行扩容。我们来分析一下:

进入该代码块的前提是底层数组已经实例化过了,其扩容阈值为threshold,当我们要插入的集合map的数据量s大于该阈值时,进行一次扩容。问题来了

如果集合map的数据量大于该阈值,仅扩容一次就够了吗?

试想一下,数组长度为16,则阈值为12,当前哈希表中有11个 键值对。此时我需要批量插入一个数据量为100的数据量,按照源码进行一次扩容,扩容后的数组长度为32,则阈值为24,而我要插入100个 键值对,况且现在已经存在11个了,这种情况下,在遍历集合并调用putVal()方法保存数据时,依然会进行多次扩容,直到数组长度为256,阈值为192,也就是说在遍历期间将会再扩容3次

因此,集合map的数据量大于该阈值,仅扩容一次可能是不够的,为什么不能像上面那样一步到位,从而避免频繁扩容呢?

所以我说这个方法比较矛盾,是因为它既做到了一步到位,又没有做到一步到位。

相关文章
|
2月前
|
存储 安全 Java
HashMap源码全面解析
HashMap源码全面解析
|
5月前
|
存储 算法 安全
HashMap超详细源码解析
1、HashMap概念 HashMap实现了Map接口,是一种使用键值对存储数据的数据结构。 HashMap允许null作为键和值。 HashMap不保证元素的顺序,特别是不保证顺序恒定。 HashMap是基于哈希表实现的数据结构,具有快速的插入、删除和查找操作。 HashMap使用了一个数组来实现哈希表,每个位置被称为桶(bucket)。 每个桶又是一个链表的头节点,用于处理哈希冲突(即两个不同的键哈希值相同)的情况。 当链表长度超过阈值(默认为8)时,链表将转化为红黑树,以提高查找效率。 当链表长度回落到阈值以下时,红黑树将转化为链表。 JDK8才引入的红黑树,JDK8之前底层结构只有数
148 1
HashMap超详细源码解析
|
存储 安全
HashMap源码解析
一直没有看HashMap源码上的Javadoc,写的是非常详细,首先翻译一波,第一部分是大概的描述,内容如下: HashMap是基于哈希表的Map接口实现,改实现提供所有可选的map操作,并且允许key为空以及value为空。HashMap和HashTable大致相等,只是HashMap是线程不安全的,而Hashtable是线程安全的,且Hashtable不允许空key和空value。 、
HashMap源码解析
|
存储 Java 容器
HashMap 1.8 源码简读
HashMap 1.8 源码简读
|
存储 缓存
LinkedHashMap源码简读
1、LinkedHashMap继承自HashMap,HashMap具有的特性它都具有。 2、实际上,LinkedHashMap是通过双向链表和散列表这两种数据组合实现的。LinkedHashMap中的“Linked”实际上指的是双向链表,并非指“用链表法解决散列冲突”。 3、LinkedHashMap不仅支持按照插入顺序遍历数据,还支持按照访问顺序来遍历数据。通过设置`accessOrder`属性为true即可。也就是说它本身就是一个支持LRU缓存淘汰策略的缓存系统。
|
安全 Java
HashMap源码学习
线程上:HashMap是线程不安全的,而HashTable是安全的。key、value的支持:HashMap的key、balue可以为空,而HashTable是key、value不可以为空的。底层数据结构:HashMap采用数组+链表+红黑树,当链表的长度>=8的时候会考虑是否转成红黑树,而HashTable则没有。初始化容量上:HashTable的初始化容量是11,同时扩容变为原来的2n+1,HashMap的初始化容量是16,同时扩容扩容成原来的2倍。而当给定初始化容量时,HashTable是直接给定初始化容量,而HashMap是将给定的初始化容量变成2的次幂。
51 0
HashMap源码学习
|
算法 Java 容器
|
存储 算法 安全
Hashmap源码解析
做什么都怕进入狗咬尾巴的怪圈,上次看hashmap源码还是2012年,这次出去面试时被问到了hashmap的问题,整体思路还是记得的,巴拉巴拉一堆。回来再看一下源码,温习一下 想要了解hashmap,就得先知道一下他的数据结构理论
220 0
Hashmap源码解析
|
存储 安全 算法
绝了!这是我见过最详细的HashMap源码解析(下)
HashMap是基于哈希表实现的,每一个元素是一个key-value对,其内部通过单链表解决冲突问题,容量不足(超过了阀值)时,同样会自动增长. HashMap是非线程安全的,只适用于单线程环境,多线程环境可以采用并发包下的concurrentHashMap HashMap 实现了Serializable接口,因此它支持序列化,实现了Cloneable接口,能被克隆 HashMap是基于哈希表的Map接口的非同步实现.此实现提供所有可选的映射操作,并允许使用null值和null键.此类不保证映射的顺序,特别是它不保证该顺序恒久不变.
129 0
绝了!这是我见过最详细的HashMap源码解析(下)
|
机器学习/深度学习 存储 安全
绝了!这是我见过最详细的HashMap源码解析(上)
HashMap是基于哈希表实现的,每一个元素是一个key-value对,其内部通过单链表解决冲突问题,容量不足(超过了阀值)时,同样会自动增长. HashMap是非线程安全的,只适用于单线程环境,多线程环境可以采用并发包下的concurrentHashMap HashMap 实现了Serializable接口,因此它支持序列化,实现了Cloneable接口,能被克隆 HashMap是基于哈希表的Map接口的非同步实现.此实现提供所有可选的映射操作,并允许使用null值和null键.此类不保证映射的顺序,特别是它不保证该顺序恒久不变.
173 0
绝了!这是我见过最详细的HashMap源码解析(上)