高频面试题-JDK源码篇(HashMap)

简介: 我觉得HashMap是一个高频面试题,甚至被问烂了,如果你还不懂HashMap原理,你很幸运,看了这边文章之后你将不存在这个问题!这里整理了一下HahsMap可能会被问到的知识点,从源码的角度去做了一些分析,当然你可以试着自己先回答一下:HashMap底层用到了那些数据结构?为什么要用到链表结构?为什么要用到红黑树?HashMap如何扩容的?HashMap是如何Put一个元素的?HashMap是如何Get一个元素的?什么是Hash冲突还有哪些解决Hash冲突的方式?

前言

我觉得HashMap是一个高频面试题,甚至被问烂了,如果你还不懂HashMap原理,你很幸运,看了这边文章之后你将不存在这个问题!这里整理了一下HahsMap可能会被问到的知识点,从源码的角度去做了一些分析,当然你可以试着自己先回答一下:

  1. HashMap底层用到了那些数据结构?
  2. 为什么要用到链表结构?
  3. 为什么要用到红黑树?
  4. HashMap如何扩容的?
  5. HashMap是如何Put一个元素的?
  6. HashMap是如何Get一个元素的?
  7. 什么是Hash冲突
  8. 还有哪些解决Hash冲突的方式?

1. HashMap底层用到了那些数据结构?

HashMap用到了数组,链表,红黑树 。 数组中的每一个元素都是一个Key-Value键值对结构的Node对象,数组初始长度为16。

HashMap源码如下:

public class HashMap<K,V> extends AbstractMap<K,V>
    implements Map<K,V>, Cloneable, Serializable {
   /** 16 初始容量
     * The default initial capacity - MUST be a power of two.
     */
    static final int DEFAULT_INITIAL_CAPACITY = 1 << 4; // aka 16
    /** 最大容量
     * The maximum capacity, used if a higher value is implicitly specified
     * by either of the constructors with arguments.
     * MUST be a power of two <= 1<<30.
     */
    static final int MAXIMUM_CAPACITY = 1 << 30;
    /** 扩容因子,元素个数达到容量的75%开始扩容
     * The load factor used when none specified in constructor.
     */
    static final float DEFAULT_LOAD_FACTOR = 0.75f;
    /** 链表节点数达到8,转换为红黑树
     * The bin count threshold for using a tree rather than list for a
     * bin.  Bins are converted to trees when adding an element to a
     * bin with at least this many nodes. The value must be greater
     * than 2 and should be at least 8 to mesh with assumptions in
     * tree removal about conversion back to plain bins upon
     * shrinkage.
     */
    static final int TREEIFY_THRESHOLD = 8;
    /** 红黑树节点个数小于6转为链表
     * The bin count threshold for untreeifying a (split) bin during a
     * resize operation. Should be less than TREEIFY_THRESHOLD, and at
     * most 6 to mesh with shrinkage detection under removal.
     */
    static final int UNTREEIFY_THRESHOLD = 6;
    ...省略...
  //一个 Node 代表一个key-value 键值对,也是数组中的一个元素
  static class Node<K,V> implements Map.Entry<K,V> {
        final int hash;//key的hash值  
        final K key;  //键
        V value;      //值
        Node<K,V> next; //指向下一个Node
   }

2. HashMap为什么要用到链表结构?

使用链表是为了解决Hash冲突问题,这就要说到HashMap存储元素的位置映射算法了,HashMap通过 hash(key) % 16 算法来计算某个key在数组中的存放位置 ,通过hash算法得到 key的hash值,对数组长度(16)取余数,结果为0到15其中一个数字,正好对应数组的索引位置。

而Hash冲突就是两个不同的 key ,使用Hash函数得到了相同的Hash值(这是有可能的),这就意味着两个各不同键值对计算出了相同的存储位置(一个位置怎么能放两个键值对呢?)这就是Hash冲突。

HashMap使用 链地址法 来解决Hash冲突,其实就是把相同位置的元素以链表的方式进行存储,如下:

你现在应该知道Node节点对象中的 next 的作用了。

3. 还有哪些解决Hash冲突的方式?

  • 第一种:拉链法/链地址法 :把Hash碰撞的元素指向一个链表,HashMap用的就是这种方法
  • 第二种:开放寻址法:当 p=h(key)出现冲突,就以p为基础产生另一个Hash,如:p1=h§,直到不冲突了把元素放在该位置
  • 第三种:再散列法:准备若干个hash函数,如果使用第一个hash函数发生了冲突,就使用第二个hash函数,第二个也冲突,使用第三个
  • 第四种:建立公共溢出区:把Hash表分为基本表和溢出表,把和基本表冲突的元素移到溢出表

4. HashMap为什么要用到红黑树?

HashMap使用红黑树是为了解决链表过长,查询变慢的问题大家都知道红黑树的查询性能是及其可观的。

如果HashMap出现Hash冲突的情况变多,那么链表的长度会越来越长,由于链表的查询方式是从前往后一个一个遍历,查询速度比较慢,所以当链表长度达到 8 的时候 ,HashMap会把链表变成一个红黑树结构来提高查询效率 , 当删除元素,红黑树的节点数小于6又会把红黑树变回链表 , 下面这2个字段就是红黑树和链表的转换阈值:

/** 链表节点数达到8,转换为红黑树
     * The bin count threshold for using a tree rather than list for a
     * bin.  Bins are converted to trees when adding an element to a
     * bin with at least this many nodes. The value must be greater
     * than 2 and should be at least 8 to mesh with assumptions in
     * tree removal about conversion back to plain bins upon
     * shrinkage.
     */
    static final int TREEIFY_THRESHOLD = 8;
    /** 红黑树节点个数小于6转为链表
     * The bin count threshold for untreeifying a (split) bin during a
     * resize operation. Should be less than TREEIFY_THRESHOLD, and at
     * most 6 to mesh with shrinkage detection under removal.
     */
    static final int UNTREEIFY_THRESHOLD = 6;

5.为什么HashMap要使用红黑树而不是用AVL平衡树

这就要说到AVL树和红黑树的特点了,这里简单说一下,红黑树的查询性能略微逊色于AVL树,因为相比AVL树红黑树会稍微不平衡最多一层,也就是说红黑树的查询性能只比相同内容的AVL树最多多一次比较,但是,红黑树在插入和删除上优于AVL树,AVL树每次插入删除会进行大量的平衡度计算,而红黑树为了维持红黑性质所做的红黑变换和旋转的开销,相较于AVL树为了维持平衡的开销要小得多

总结:AVL查询性能好,增删性能差,红黑树查询和增删性能相对折中,实际应用中,若搜索的次数远远大于插入和删除,那么选择AVL,如果搜索,插入删除次数几乎差不多,应该选择红黑树。

HashMap选择红黑树就是因为我们使用Map查询和增删该都会涉及到。

为什么不使用多叉树?多叉树和用于大数据存储,或者文件系统存储,不太适合HashMap这种小数据量存储结构。

6. HashMap如何扩容的?

HashMap的扩容因子是0.75,也就是说当数组中的已存储节点数(Node) > 数组容量 ∗ 扩容因子时,就需要扩容,调整数组的大小为当前的 2 倍

/** 扩容因子,元素个数达到容量的75%开始扩容
     * The load factor used when none specified in constructor.
     */
    static final float DEFAULT_LOAD_FACTOR = 0.75f;

扩容的方式是创建 2 倍容量的新的数组,然后把所有元素重新hash到新的数组中(数组长度变量,需要重新计算元素的存储位置)。

7. HashMap是如何Put一个元素的?

put执行流程如下:

  1. 为key计算出hash值
  2. 根据key的hash值计算出存储位置(16 - 1) & hash 等同于 hash % 16
  3. 取出该位置的值,如果为空,就把传入的key-value包装成Node,加入该位置
  4. 如果该位置已经有值了,就出现了hash碰撞了,该Node后面可能有一个链表,或者红黑树
  5. 判断该位置的元素的key和传入的key是否一样,如果一样就做值的覆盖操作
  6. 如果该位置的元素的key和传入的key不一样, 那就判断Node的类型是不是红黑树
  7. 如果是红黑树就走红黑树的添加流程
  8. 如果不是红黑树,就遍历链表,取出该位置的元素,使用next往后遍历 。如果遍历的过程中某个Key和传入的key一致了,就覆盖值,否则遍历到最后next为nul,就把传入的新元素存储到链表尾。
  9. 同时要判断链表的元素如果大于8了要进行红黑树的转换。

put方法源码

public V put(K key, V value) {
    return putVal(hash(key), key, value, false, true);
}

计算hash值

static final int hash(Object key) {
    int h;
    //计算hash值
     return (key == null) ? 0 : (h = key.hashCode()) ^ (h >>> 16);
 }

put主流程

final V putVal(int hash, K key, V value, boolean onlyIfAbsent,
                  boolean evict) {
       Node<K,V>[] tab; Node<K,V> p; int n, i;
       //1.如果数组是空的,调用 resize() 初始化数组
       if ((tab = table) == null || (n = tab.length) == 0)
           //tab就是数组, n是数组长度
           n = (tab = resize()).length;
        // 2.计算位置: (n - 1) & hash  等同于   hash % 16 ,计算key的存储位置
        // 3.取出该位置的元素是否为空
       if ((p = tab[i = (n - 1) & hash]) == null)
        //4.如果为空,就创建一个新Node,把当前的key-value存储进去
           tab[i] = newNode(hash, key, value, null);
       else {
          //到这里说明hash冲突了,该位置有元素,那么就有2种执行方案:
          //如果有和当前传入key相同的key存住,覆盖值,如果没有和传入的key相同的key,那就添加元素
           Node<K,V> e; K k;
           //5.如果key相等,hash值也相等,进行值的覆盖
           if (p.hash == hash &&
               ((k = p.key) == key || (key != null && key.equals(k))))
               e = p;
            //6.如果不满足第5步,那就要进行链表或者红黑树的遍历了 , 这里在判断是不是红黑树
           else if (p instanceof TreeNode)
            //走红黑树的添加流程
               e = ((TreeNode<K,V>)p).putTreeVal(this, tab, hash, key, value);
           else {
            //7.到这里就是链表了 , 循环链表
               for (int binCount = 0; ; ++binCount) {
                //8.通过next一个一个往下遍历,如果某一个node的next为空 ,说明找到最后一个Node了,
                //就把新的key-value加入最后一个元素的next
                   if ((e = p.next) == null) {
                       p.next = newNode(hash, key, value, null);
                       //这里在判断是否要做红黑树转变
                       if (binCount >= TREEIFY_THRESHOLD - 1) // -1 for 1st
                           treeifyBin(tab, hash);
                       break;
                   }
                   //9.如果在遍历的过程中,找到了和传入的key一样的key,hash值也一样,那就进行值的覆盖
                   if (e.hash == hash &&
                       ((k = e.key) == key || (key != null && key.equals(k))))
                       break;
                   p = e;
               }
           }
           if (e != null) { // existing mapping for key
               V oldValue = e.value;
               if (!onlyIfAbsent || oldValue == null)
                   e.value = value; //10.用新的值覆盖老的值
               afterNodeAccess(e);
               return oldValue;
           }
       }
       ++modCount;
       if (++size > threshold)
           resize();
       afterNodeInsertion(evict);
       return null;
   }

8. HashMap是如何Get一个元素的?

其实根据put流程就能推断出Get流程

  1. 根据key计算hash值
  2. 根据hash % 16 计算出Key的存储位置
  3. 把该位置的元素取出来,使用传入的key和该位置第一个元素的 key进行比较,如果相同,就返回
  4. 如果第一个元素不是查找的元素,就进行链表或者红黑树的遍历
  5. 如果第一个节点类型是TreeNode,就走红黑树的查找流程
  6. 如果类型不是TreeNode,就遍历链表,一边遍历一遍比较key,如果key相同就返回值,直到next为null。

get方法入口:

public V get(Object key) {
        Node<K,V> e;
        //hash(key):计算key的hash值
        return (e = getNode(hash(key), key)) == null ? null : e.value;
    }

get主流程:

final Node<K,V> getNode(int hash, Object key) {
        Node<K,V>[] tab; Node<K,V> first, e; int n; K k;
        if ((tab = table) != null && (n = tab.length) > 0 &&
        //计算key存储位置,取出该位置的元素
            (first = tab[(n - 1) & hash]) != null) {
            //检查是不是第一个元素,比较key,如果是直接返回
            if (first.hash == hash && // always check first node
                ((k = first.key) == key || (key != null && key.equals(k))))
                //直接返回第一个元素
                return first;
                //如果next不为空,开始遍历链表
            if ((e = first.next) != null) {
               //如果是红黑树,就遍历红黑树
                if (first instanceof TreeNode)
                    return ((TreeNode<K,V>)first).getTreeNode(hash, key);
                do {
                  //一直next遍历下一个元素,然后比较key,知道遍历完
                    if (e.hash == hash &&
                        ((k = e.key) == key || (key != null && key.equals(k))))
                        return e;
                } while ((e = e.next) != null);
            }
        }
        return null;
    }

9.你知道HashMap在多线程下死循环问题吗

这个问题在JDK1.8中已经得到解决,在JDK1.7及以前是有这个问题,造成原因是因为之前HashMap链表插入元素使用的是头插法,当HashMap扩容后,进行元素重新Hash位置重排的时候会出现链表上的元素循环指向的问题。

比如:有链表上元素按照:A -> B -> C 顺序排列,三者Hash值相同 , 现在HashMap扩容,然后进行元素重新Hash,A,B,C三者由于Hash值相同,在新的数组中依然会计算出相同的存储位置。

我们可以这样理解,链表上的元素在进行重新Hash的时候是先取第一个元素A进行Hash,然后存储到数组上的某个位置 , 然后再取B进行Hash,同样存储到该位置,由于使用头插法,所以形成了下图第二部的效果:B -> A , 这时你已经意识到问题了,在之前的链表上是: A -> B, 而重新Hash之后变成了B -> A ,其实这里就出现了元素相互引用的问题,即:死循环。

JDK1.8通过链表元素尾插法解决了这个问题,尾插法可以维持原有链表的顺序:

10.在多线程环境中能使用HashMap吗?

不能,HashMap暴露给外界的方法并不是同步的,在多线程环境中是可能会出现线程安全问题,在多线程环境中可以使用HashTable ,或者ConcurrentHashMap。 HashTable直接使用 synchronized 同步锁来保证线程安全,比较古老现在基本不用了。ConcurrentHashMap是JUC并发库中的容器 ,它是专门为多线程环境设计,并发控制使用 Synchronized 和 CAS 来操作,性能良好,在JDK1.8中ConcurrentHashMap也使用到了数组链表红黑树的结构来存储数据。

11.HashMap和HashTable的区别

HashTable是HashMap的线程安全版本,也是比较老旧的一个map,HashTable方法是加了同步锁,线程安全,性能会受到影响。而HashMap没有加同步锁,线程不安全,但是性能更高。

Hashtable既不支持Null key也不支持Null value , 而HashMap值可以为null,key支持一个key为nul。

目录
相关文章
|
2月前
|
监控 Java 应用服务中间件
高级java面试---spring.factories文件的解析源码API机制
【11月更文挑战第20天】Spring Boot是一个用于快速构建基于Spring框架的应用程序的开源框架。它通过自动配置、起步依赖和内嵌服务器等特性,极大地简化了Spring应用的开发和部署过程。本文将深入探讨Spring Boot的背景历史、业务场景、功能点以及底层原理,并通过Java代码手写模拟Spring Boot的启动过程,特别是spring.factories文件的解析源码API机制。
92 2
|
14天前
|
Java 数据库连接 Maven
最新版 | 深入剖析SpringBoot3源码——分析自动装配原理(面试常考)
自动装配是现在面试中常考的一道面试题。本文基于最新的 SpringBoot 3.3.3 版本的源码来分析自动装配的原理,并在文未说明了SpringBoot2和SpringBoot3的自动装配源码中区别,以及面试回答的拿分核心话术。
最新版 | 深入剖析SpringBoot3源码——分析自动装配原理(面试常考)
|
5天前
|
存储 算法 Java
面试必备!一文搞懂HashMap如何优雅处理哈希冲突
大家好,我是小米,一个积极的程序员。今天聊聊Java面试中的常见问题——“HashMap是怎么解决哈希冲突的?”。通过一个小故事,我们了解到HashMap使用链地址法(JDK 1.8前)和红黑树(JDK 1.8后)来处理哈希冲突。链地址法用链表存储冲突的元素,而红黑树在链表长度超过8时启用,提升查找效率。希望这个讲解能帮助你更好地理解HashMap的工作原理。欢迎留言讨论,关注我的公众号“软件求生”,获取更多技术干货!
23 3
|
1月前
|
存储 缓存 Java
Spring面试必问:手写Spring IoC 循环依赖底层源码剖析
在Spring框架中,IoC(Inversion of Control,控制反转)是一个核心概念,它允许容器管理对象的生命周期和依赖关系。然而,在实际应用中,我们可能会遇到对象间的循环依赖问题。本文将深入探讨Spring如何解决IoC中的循环依赖问题,并通过手写源码的方式,让你对其底层原理有一个全新的认识。
57 2
|
3月前
|
存储 Java 程序员
Java面试加分点!一文读懂HashMap底层实现与扩容机制
本文详细解析了Java中经典的HashMap数据结构,包括其底层实现、扩容机制、put和查找过程、哈希函数以及JDK 1.7与1.8的差异。通过数组、链表和红黑树的组合,HashMap实现了高效的键值对存储与检索。文章还介绍了HashMap在不同版本中的优化,帮助读者更好地理解和应用这一重要工具。
80 5
|
4月前
|
设计模式 Java 关系型数据库
【Java笔记+踩坑汇总】Java基础+JavaWeb+SSM+SpringBoot+SpringCloud+瑞吉外卖/谷粒商城/学成在线+设计模式+面试题汇总+性能调优/架构设计+源码解析
本文是“Java学习路线”专栏的导航文章,目标是为Java初学者和初中高级工程师提供一套完整的Java学习路线。
505 37
|
3月前
|
存储 算法 安全
HashMap常见面试题(超全面):实现原理、扩容机制、链表何时升级为红黑树、死循环
HashMap常见面试题:红黑树、散列表,HashMap实现原理、扩容机制,HashMap的jd1.7与jdk1.8有什么区别,寻址算法、链表何时升级为红黑树、死循环
|
5月前
|
算法 安全 Java
深入JDK源码:揭开ConcurrentHashMap底层结构的神秘面纱
【8月更文挑战第24天】`ConcurrentHashMap`是Java并发编程中不可或缺的线程安全哈希表实现。它通过精巧的锁机制和无锁算法显著提升了并发性能。本文首先介绍了早期版本中使用的“段”结构,每个段是一个带有独立锁的小型哈希表,能够减少线程间竞争并支持动态扩容以应对高并发场景。随后探讨了JDK 8的重大改进:取消段的概念,采用更细粒度的锁控制,并引入`Node`等内部类以及CAS操作,有效解决了哈希冲突并实现了高性能的并发访问。这些设计使得`ConcurrentHashMap`成为构建高效多线程应用的强大工具。
62 2
|
5月前
|
安全 Java
【Java集合类面试十六】、HashMap与ConcurrentHashMap有什么区别?
HashMap是非线程安全的,而ConcurrentHashMap通过减少锁粒度来提高并发性能,检索操作无需锁,从而提供更好的线程安全性和性能。
|
2月前
|
存储 缓存 算法
面试官:单核 CPU 支持 Java 多线程吗?为什么?被问懵了!
本文介绍了多线程环境下的几个关键概念,包括时间片、超线程、上下文切换及其影响因素,以及线程调度的两种方式——抢占式调度和协同式调度。文章还讨论了减少上下文切换次数以提高多线程程序效率的方法,如无锁并发编程、使用CAS算法等,并提出了合理的线程数量配置策略,以平衡CPU利用率和线程切换开销。
面试官:单核 CPU 支持 Java 多线程吗?为什么?被问懵了!