Java中HashMap的原理分析

简介:


HashMap在Java开发中有着非常重要的角色地位,每一个Java程序员都应该了解HashMap。详细地阐述HashMap中的几个概念,并深入探讨HashMap的内部结构和实现细节,讨论HashMap的性能问题。

我们先来看这样的一道面试题:

在 HashMap 中存放的一系列键值对,其中键为某个我们自定义的类型。放入 HashMap 后,我们在外部把某一个 key 的属性进行更改,然后我们再用这个 key 从 HashMap 里取出元素,这时候 HashMap 会返回什么?

文中已给出示例代码与答案,但关于HashMap的原理没有做出解释。

1. 特性

我们可以用任何类作为HashMap的key,但是对于这些类应该有什么限制条件呢?且看下面的代码:


 
 
  1. public class Person { 
  2.   private String name; 
  3.   
  4.   public Person(String name) { 
  5.     this.name = name; 
  6.   } 
  7.   
  8. Map<Person, String> testMap = new HashMap<>(); 
  9. testMap.put(new Person("hello"), "world"); 
  10. testMap.get(new Person("hello")); // ---> null 

本是想取出具有相等字段值Person类的value,结果却是null。对HashMap稍有了解的人看出来——Person类并没有override hashcode方法,导致其继承的是Object的hashcode(返回是其内存地址)。这也是为什么常用不变类如String(或Integer等)做为HashMap的key的原因。那么,HashMap是如何利用hashcode给key做快速索引的呢?

2. 原理

首先,我们来看《Thinking in Java》中一个简单HashMap的实现方案:


 
 
  1. //: containers/SimpleHashMap.java 
  2. // A demonstration hashed Map. 
  3. import java.util.*; 
  4. import net.mindview.util.*; 
  5.   
  6. public class SimpleHashMap<K,V> extends AbstractMap<K,V> { 
  7.  // Choose a prime number for the hash table size, to achieve a uniform distribution: 
  8.  static final int SIZE = 997
  9.  // You can't have a physical array of generics, but you can upcast to one: 
  10.  @SuppressWarnings("unchecked") 
  11.  LinkedList<MapEntry<K,V>>[] buckets = 
  12.   new LinkedList[SIZE]; 
  13.  public V put(K key, V value) { 
  14.   V oldValue = null
  15.   int index = Math.abs(key.hashCode()) % SIZE; 
  16.   if(buckets[index] == null) 
  17.    buckets[index] = new LinkedList<MapEntry<K,V>>(); 
  18.   LinkedList<MapEntry<K,V>> bucket = buckets[index]; 
  19.   MapEntry<K,V> pair = new MapEntry<K,V>(key, value); 
  20.   boolean found = false
  21.   ListIterator<MapEntry<K,V>> it = bucket.listIterator(); 
  22.   while(it.hasNext()) { 
  23.    MapEntry<K,V> iPair = it.next(); 
  24.    if(iPair.getKey().equals(key)) { 
  25.     oldValue = iPair.getValue(); 
  26.     it.set(pair); // Replace old with new 
  27.     found = true
  28.     break; 
  29.    } 
  30.   } 
  31.   if(!found) 
  32.    buckets[index].add(pair); 
  33.   return oldValue; 
  34.  } 
  35.  public V get(Object key) { 
  36.   int index = Math.abs(key.hashCode()) % SIZE; 
  37.   if(buckets[index] == null) return null; 
  38.   for(MapEntry<K,V> iPair : buckets[index]) 
  39.    if(iPair.getKey().equals(key)) 
  40.     return iPair.getValue(); 
  41.   return null; 
  42.  } 
  43.  public Set<Map.Entry<K,V>> entrySet() { 
  44.   Set<Map.Entry<K,V>> setnew HashSet<Map.Entry<K,V>>(); 
  45.   for(LinkedList<MapEntry<K,V>> bucket : buckets) { 
  46.    if(bucket == null) continue; 
  47.    for(MapEntry<K,V> mpair : bucket) 
  48.     set.add(mpair); 
  49.   } 
  50.   return set; 
  51.  } 
  52.  public static void main(String[] args) { 
  53.   SimpleHashMap<String,String> m = 
  54.    new SimpleHashMap<String,String>(); 
  55.   m.putAll(Countries.capitals(25)); 
  56.   System.out.println(m); 
  57.   System.out.println(m.get("ERITREA")); 
  58.   System.out.println(m.entrySet()); 
  59.  } 

SimpleHashMap构造一个hash表来存储key,hash函数是取模运算Math.abs(key.hashCode()) % SIZE,采用链表法解决hash冲突;buckets的每一个槽位对应存放具有相同(hash后)index值的Map.Entry,如下图所示:

JDK的HashMap的实现原理与之相类似,其采用链地址的hash表table存储Map.Entry:


 
 
  1. /** 
  2.  * The table, resized as necessary. Length MUST Always be a power of two. 
  3.  */ 
  4. transient Entry<K,V>[] table = (Entry<K,V>[]) EMPTY_TABLE; 
  5.   
  6. static class Entry<K,V> implements Map.Entry<K,V> { 
  7.   final K key; 
  8.   V value; 
  9.   Entry<K,V> next; 
  10.   int hash; 
  11.   … 

Map.Entry的index是对key的hashcode进行hash后所得。当要get key对应的value时,则对key计算其index,然后在table中取出Map.Entry即可得到,具体参看代码:


 
 
  1. public V get(Object key) { 
  2.   if (key == null) 
  3.     return getForNullKey(); 
  4.   Entry<K,V> entry = getEntry(key); 
  5.   
  6.   return null == entry ? null : entry.getValue(); 
  7.   
  8. final Entry<K,V> getEntry(Object key) { 
  9.   if (size == 0) { 
  10.     return null; 
  11.   } 
  12.   
  13.   int hash = (key == null) ? 0 : hash(key); 
  14.   for (Entry<K,V> e = table[indexFor(hash, table.length)]; 
  15.      e != null; 
  16.      ee = e.next) { 
  17.     Object k; 
  18.     if (e.hash == hash && 
  19.       ((k = e.key) == key || (key != null && key.equals(k)))) 
  20.       return e; 
  21.   } 
  22.   return null; 

可见,hashcode直接影响HashMap的hash函数的效率——好的hashcode会极大减少hash冲突,提高查询性能。同时,这也解释开篇提出的两个问题:如果自定义的类做HashMap的key,则hashcode的计算应涵盖构造函数的所有字段,否则有可能得到null。


作者:佚名

来源:51CTO

相关文章
|
9天前
|
存储 缓存 算法
HashMap深度解析:从原理到实战
HashMap,作为Java集合框架中的一个核心组件,以其高效的键值对存储和检索机制,在软件开发中扮演着举足轻重的角色。作为一名资深的AI工程师,深入理解HashMap的原理、历史、业务场景以及实战应用,对于提升数据处理和算法实现的效率至关重要。本文将通过手绘结构图、流程图,结合Java代码示例,全方位解析HashMap,帮助读者从理论到实践全面掌握这一关键技术。
48 13
|
1月前
|
Java
Java之HashMap详解
本文介绍了Java中HashMap的源码实现(基于JDK 1.8)。HashMap是基于哈希表的Map接口实现,允许空值和空键,不同步且线程不安全。文章详细解析了HashMap的数据结构、主要方法(如初始化、put、get、resize等)的实现,以及树化和反树化的机制。此外,还对比了JDK 7和JDK 8中HashMap的主要差异,并提供了使用HashMap时的一些注意事项。
Java之HashMap详解
|
1月前
HashMap原理
1.HashMap在Jdk1.8以后是基于数组+链表+红黑树来实现的,特点是,key不能重复,可以为null,线程不安全 2.HashMap的扩容机制: HashMap的默认容量为16,默认的负载因子为0.75,当HashMap中元素个数超过容量乘以负载因子的个数时,就创建一个大小为前一次两倍的新数组,再将原来数组中的数据复制到新数组中。当数组长度到达64且链表长度大于8时,链表转为红黑树
32 2
|
3天前
|
缓存 算法 搜索推荐
Java中的算法优化与复杂度分析
在Java开发中,理解和优化算法的时间复杂度和空间复杂度是提升程序性能的关键。通过合理选择数据结构、避免重复计算、应用分治法等策略,可以显著提高算法效率。在实际开发中,应该根据具体需求和场景,选择合适的优化方法,从而编写出高效、可靠的代码。
15 6
|
3天前
|
监控 Java API
探索Java NIO:究竟在哪些领域能大显身手?揭秘原理、应用场景与官方示例代码
Java NIO(New IO)自Java SE 1.4引入,提供比传统IO更高效、灵活的操作,支持非阻塞IO和选择器特性,适用于高并发、高吞吐量场景。NIO的核心概念包括通道(Channel)、缓冲区(Buffer)和选择器(Selector),能实现多路复用和异步操作。其应用场景涵盖网络通信、文件操作、进程间通信及数据库操作等。NIO的优势在于提高并发性和性能,简化编程;但学习成本较高,且与传统IO存在不兼容性。尽管如此,NIO在构建高性能框架如Netty、Mina和Jetty中仍广泛应用。
17 3
|
3天前
|
安全 算法 Java
Java CAS原理和应用场景大揭秘:你掌握了吗?
CAS(Compare and Swap)是一种乐观锁机制,通过硬件指令实现原子操作,确保多线程环境下对共享变量的安全访问。它避免了传统互斥锁的性能开销和线程阻塞问题。CAS操作包含三个步骤:获取期望值、比较当前值与期望值是否相等、若相等则更新为新值。CAS广泛应用于高并发场景,如数据库事务、分布式锁、无锁数据结构等,但需注意ABA问题。Java中常用`java.util.concurrent.atomic`包下的类支持CAS操作。
23 2
|
1月前
|
存储 算法 Java
大厂面试高频:什么是自旋锁?Java 实现自旋锁的原理?
本文详解自旋锁的概念、优缺点、使用场景及Java实现。关注【mikechen的互联网架构】,10年+BAT架构经验倾囊相授。
大厂面试高频:什么是自旋锁?Java 实现自旋锁的原理?
|
1月前
|
Java
Java之CountDownLatch原理浅析
本文介绍了Java并发工具类`CountDownLatch`的使用方法、原理及其与`Thread.join()`的区别。`CountDownLatch`通过构造函数接收一个整数参数作为计数器,调用`countDown`方法减少计数,`await`方法会阻塞当前线程,直到计数为零。文章还详细解析了其内部机制,包括初始化、`countDown`和`await`方法的工作原理,并给出了一个游戏加载场景的示例代码。
Java之CountDownLatch原理浅析
|
1月前
|
Java 索引 容器
Java ArrayList扩容的原理
Java 的 `ArrayList` 是基于数组实现的动态集合。初始时,`ArrayList` 底层创建一个空数组 `elementData`,并设置 `size` 为 0。当首次添加元素时,会调用 `grow` 方法将数组扩容至默认容量 10。之后每次添加元素时,如果当前数组已满,则会再次调用 `grow` 方法进行扩容。扩容规则为:首次扩容至 10,后续扩容至原数组长度的 1.5 倍或根据实际需求扩容。例如,当需要一次性添加 100 个元素时,会直接扩容至 110 而不是 15。
Java ArrayList扩容的原理
|
26天前
|
监控 算法 Java
jvm-48-java 变更导致压测应用性能下降,如何分析定位原因?
【11月更文挑战第17天】当JVM相关变更导致压测应用性能下降时,可通过检查变更内容(如JVM参数、Java版本、代码变更)、收集性能监控数据(使用JVM监控工具、应用性能监控工具、系统资源监控)、分析垃圾回收情况(GC日志分析、内存泄漏检查)、分析线程和锁(线程状态分析、锁竞争分析)及分析代码执行路径(使用代码性能分析工具、代码审查)等步骤来定位和解决问题。