Java面试加分点!一文读懂HashMap底层实现与扩容机制

简介: 本文详细解析了Java中经典的HashMap数据结构,包括其底层实现、扩容机制、put和查找过程、哈希函数以及JDK 1.7与1.8的差异。通过数组、链表和红黑树的组合,HashMap实现了高效的键值对存储与检索。文章还介绍了HashMap在不同版本中的优化,帮助读者更好地理解和应用这一重要工具。



哈喽大家好!今天咱们来聊聊Java中最经典的数据结构之一——HashMap!如果你是Java开发者,那你一定对它不陌生。HashMap 是我们进行键值对存储的好帮手,几乎是我们在日常开发中离不开的工具。本文会从数据结构、扩容机制、put和查找过程、哈希函数以及JDK 1.7与1.8的差异等多方面,来详细拆解一下HashMap的底层原理!Let's go~

数据结构:数组 + 链表 + 红黑树

在Java的HashMap中,底层数据结构是数组、链表、红黑树三者的组合。通过键值对的哈希映射,HashMap可以实现快速的数据存取。那么,HashMap是如何把这三种数据结构组合起来的呢?

  • 数组:这是HashMap的核心存储空间,称为table。当我们通过key来存取数据时,实际是把key通过哈希函数映射到table中的某个索引位置。
  • 链表:在HashMap中,链表主要是用来处理哈希冲突的。如果多个key被映射到了同一个数组索引,那么这些冲突的元素会被放在一个链表中,以链表形式存储。
  • 红黑树:在JDK1.8引入了红黑树,以优化链表的查找效率。若一个索引下的链表长度超过8,并且数组长度大于64,HashMap会将链表转换成红黑树。这样可以将查找的时间复杂度从O(n)降到O(log n),大幅度提升性能。

扩容情况:为什么是2的幂次方?

HashMap在扩容机制上也是独具匠心。扩容不仅影响性能,还会影响数据的分布和哈希碰撞,所以在容量和扩容机制设计上,HashMap非常讲究。

  • 默认大小和负载因子:HashMap的默认容量是16,负载因子是0.75。也就是说,当HashMap的填充度超过75%时,就会触发扩容操作,避免因为过多的哈希冲突而降低性能。
  • 扩容机制:扩容发生时,HashMap会将当前容量翻倍,并重新将所有元素重新哈希到新的数组中。
  • 容量始终是2的幂次方:HashMap的容量总是保持2的幂次方。这样设计的原因主要有以下几点:
  • 2的幂次方可以使(n-1) & hash的运算分布更均匀,减少哈希碰撞。
  • 使用位运算&替代取模操作,效率更高。

put方法的过程

HashMapput方法可以说是HashMap的精髓之一,理解它的执行过程,有助于我们掌握HashMap的存储机制。put方法主要分以下几个步骤:

  1. 判断table是否为空:如果table为空,HashMap会进行初始化操作,将容量扩充为默认大小16。
  2. 计算hash值和索引位置:通过key的hashCode值经过扰动函数处理后,再通过(n - 1) & hash计算出该元素存放的数组下标index。
  3. 检查是否有哈希冲突:检查table[index]处是否已经有节点。
  1. 如果没有节点,直接构造一个新的Node节点放入table[index]处;
  2. 如果已经有节点,说明发生了哈希冲突,进入下一步判断。
  1. 哈希冲突处理:在处理哈希冲突时,HashMap通过链表和红黑树来解决冲突。
  1. 若现有节点的key与新节点的key相同,就会用新的value覆盖原有值。
  2. 如果不相同,检查现有节点类型,如果是链表节点,则将新节点添加到链表中;如果链表长度超过阈值8且数组长度大于64,会将链表转换为红黑树。
  1. 判断是否需要扩容:当插入完成后,HashMap会检查当前容量是否超过负载因子0.75的阈值,如果超过则触发扩容。

哈希函数:扰动函数与hash计算

HashMap的哈希函数不仅仅是简单地用key.hashCode()来决定索引位置,因为直接使用hashCode()的低效与不均匀会导致大量哈希碰撞。因此,HashMap采用了一种“扰动函数”来优化哈希值的计算过程。

  • HashMap在计算key的哈希值时,先对key的hashCode()进行一次扰动,将hashCode的高16位和低16位进行异或运算。
  • 这个“扰动”能让哈希结果更加均匀分布,尽可能地减少哈希碰撞。

经过扰动处理后的哈希值,最终会通过(n - 1) & hash来计算索引位置,这样可以确保得到的索引位置始终位于数组范围内。

JDK1.7与JDK1.8的区别

在JDK1.7与JDK1.8之间,HashMap的实现有一些关键性变化:

  • 数据结构:JDK1.7中,HashMap采用了“数组+链表”的组合,而JDK1.8中则采用“数组+链表+红黑树”三者结合的结构。在JDK1.8中,当链表长度超过8且数组长度大于64时,链表会转化为红黑树以优化查找性能,避免长链表造成的性能瓶颈。
  • hash冲突处理方式:在JDK1.7中,链表插入新节点时采用的是头插法,这样做的好处是插入速度较快,但在并发情况下可能会产生死循环(例如在rehash期间)。而在JDK1.8中,链表插入时采用了尾插法,避免了并发扩容时死循环的问题。
  • 扩容过程:JDK1.8中,HashMap的扩容更为智能高效,通过高位运算决定节点位置是否发生变化。扩容时不再重新计算所有节点的哈希值,只需检查每个节点的高位,决定是否需要搬移至新数组。
  • 性能优化:JDK1.8的HashMap在多线程环境下性能优化明显,解决了JDK1.7在并发条件下扩容时可能导致的死循环问题。总体来看,JDK1.8的HashMap在结构上更为合理,更适用于高并发场景。

END

好了,这就是HashMap的底层设计和实现原理,学会这些知识之后,再遇到关于HashMap的面试题,你一定可以轻松应对!

  • 底层结构:HashMap采用数组、链表、红黑树组合的数据结构来存储键值对。
  • 扩容机制:HashMap默认负载因子为0.75,扩容时容量翻倍,始终保持2的幂次方以提高存储效率。
  • put过程:put方法主要包括判断初始化、计算hash值、解决哈希冲突、扩容等几个步骤。
  • 哈希函数:采用扰动函数,降低哈希碰撞,确保元素均匀分布。
  • JDK1.7 vs JDK1.8:1.8引入红黑树和尾插法处理冲突,避免了死循环,提高了多线程环境的安全性。

希望这篇文章能帮你更深入地理解HashMap!感谢阅读,欢迎留言讨论~

我是小米,一个喜欢分享技术的29岁程序员。如果你喜欢我的文章,欢迎关注我的微信公众号软件求生,获取更多技术干货!

相关文章
|
4天前
|
缓存 运维 Java
Java静态代码块深度剖析:机制、特性与最佳实践
在Java中,静态代码块(或称静态初始化块)是指类中定义的一个或多个`static { ... }`结构。其主要功能在于初始化类级别的数据,例如静态变量的初始化或执行仅需运行一次的初始化逻辑。
23 4
|
21天前
|
存储 缓存 安全
Java HashMap详解及实现原理
Java HashMap是Java集合框架中常用的Map接口实现,基于哈希表结构,允许null键和值,提供高效的存取操作。它通过哈希函数将键映射到数组索引,并使用链表或红黑树解决哈希冲突。HashMap非线程安全,多线程环境下需注意并发问题,常用解决方案包括ConcurrentHashMap和Collections.synchronizedMap()。此外,合理设置初始化容量和加载因子、重写hashCode()和equals()方法有助于提高性能和避免哈希冲突。
49 17
Java HashMap详解及实现原理
|
24天前
|
Java 程序员 开发者
Java社招面试题:一个线程运行时发生异常会怎样?
大家好,我是小米。今天分享一个经典的 Java 面试题:线程运行时发生异常,程序会怎样处理?此问题考察 Java 线程和异常处理机制的理解。线程发生异常,默认会导致线程终止,但可以通过 try-catch 捕获并处理,避免影响其他线程。未捕获的异常可通过 Thread.UncaughtExceptionHandler 处理。线程池中的异常会被自动处理,不影响任务执行。希望这篇文章能帮助你深入理解 Java 线程异常处理机制,为面试做好准备。如果你觉得有帮助,欢迎收藏、转发!
97 14
|
27天前
|
安全 Java 程序员
Java 面试必问!线程构造方法和静态块的执行线程到底是谁?
大家好,我是小米。今天聊聊Java多线程面试题:线程类的构造方法和静态块是由哪个线程调用的?构造方法由创建线程实例的主线程调用,静态块在类加载时由主线程调用。理解这些细节有助于掌握Java多线程机制。下期再见! 简介: 本文通过一个常见的Java多线程面试题,详细讲解了线程类的构造方法和静态块是由哪个线程调用的。构造方法由创建线程实例的主线程调用,静态块在类加载时由主线程调用。理解这些细节对掌握Java多线程编程至关重要。
54 13
|
2月前
|
Java 程序员 调度
Java 高级面试技巧:yield() 与 sleep() 方法的使用场景和区别
本文详细解析了 Java 中 `Thread` 类的 `yield()` 和 `sleep()` 方法,解释了它们的作用、区别及为什么是静态方法。`yield()` 让当前线程释放 CPU 时间片,给其他同等优先级线程运行机会,但不保证暂停;`sleep()` 则让线程进入休眠状态,指定时间后继续执行。两者都是静态方法,因为它们影响线程调度机制而非单一线程行为。这些知识点在面试中常被提及,掌握它们有助于更好地应对多线程编程问题。
83 9
|
2月前
|
算法 安全 Java
Java线程调度揭秘:从算法到策略,让你面试稳赢!
在社招面试中,关于线程调度和同步的相关问题常常让人感到棘手。今天,我们将深入解析Java中的线程调度算法、调度策略,探讨线程调度器、时间分片的工作原理,并带你了解常见的线程同步方法。让我们一起破解这些面试难题,提升你的Java并发编程技能!
98 16
|
2月前
|
Java 程序员
Java社招面试中的高频考点:Callable、Future与FutureTask详解
大家好,我是小米。本文主要讲解Java多线程编程中的三个重要概念:Callable、Future和FutureTask。它们在实际开发中帮助我们更灵活、高效地处理多线程任务,尤其适合社招面试场景。通过 Callable 可以定义有返回值且可能抛出异常的任务;Future 用于获取任务结果并提供取消和检查状态的功能;FutureTask 则结合了两者的优势,既可执行任务又可获取结果。掌握这些知识不仅能提升你的编程能力,还能让你在面试中脱颖而出。文中结合实例详细介绍了这三个概念的使用方法及其区别与联系。希望对大家有所帮助!
191 60
|
2月前
|
安全 Java 程序员
Java面试必问!run() 和 start() 方法到底有啥区别?
在多线程编程中,run和 start方法常常让开发者感到困惑。为什么调用 start 才能启动线程,而直接调用 run只是普通方法调用?这篇文章将通过一个简单的例子,详细解析这两者的区别,帮助你在面试中脱颖而出,理解多线程背后的机制和原理。
77 12
|
4月前
|
存储 缓存 算法
面试官:单核 CPU 支持 Java 多线程吗?为什么?被问懵了!
本文介绍了多线程环境下的几个关键概念,包括时间片、超线程、上下文切换及其影响因素,以及线程调度的两种方式——抢占式调度和协同式调度。文章还讨论了减少上下文切换次数以提高多线程程序效率的方法,如无锁并发编程、使用CAS算法等,并提出了合理的线程数量配置策略,以平衡CPU利用率和线程切换开销。
面试官:单核 CPU 支持 Java 多线程吗?为什么?被问懵了!
|
4月前
|
存储 算法 Java
大厂面试高频:什么是自旋锁?Java 实现自旋锁的原理?
本文详解自旋锁的概念、优缺点、使用场景及Java实现。关注【mikechen的互联网架构】,10年+BAT架构经验倾囊相授。
大厂面试高频:什么是自旋锁?Java 实现自旋锁的原理?

热门文章

最新文章