一篇文章带你吃透 hashmap(面试指南升级版)

简介: 威力加强版已更新,大家可以移步:一文读懂JDK1.7,JDK1.8,JDK1.9的hashmap,hashtable,conc... - 简书1:hashmap简介(如下,数组-链表形式)HashMap的存储结构图中,紫色部分即代表哈希表,也称为哈希数组(默认数组大小是16,每对key-value键值对其实是存在map的内部类entry里的),数组的每个元素都是一个单链表的头节点,跟着的绿色链表是用来解决冲突的,如果不同的key映射到了数组的同一位置处,就将其放入单链表中。

威力加强版已更新,大家可以移步:一文读懂JDK1.7,JDK1.8,JDK1.9的hashmap,hashtable,conc... - 简书

1:hashmap简介(如下,数组-链表形式)

HashMap的存储结构

图中,紫色部分即代表哈希表,也称为哈希数组(默认数组大小是16,每对key-value键值对其实是存在map的内部类entry里的),数组的每个元素都是一个单链表的头节点,跟着的绿色链表是用来解决冲突的,如果不同的key映射到了数组的同一位置处,就将其放入单链表中

2:hashmap原理(即put和get原理)

2.1 put原理

1.根据key获取对应hash值:int hash = hash(key.hash.hashcode())

2.根据hash值和数组长度确定对应数组引int i = indexFor(hash, table.length); 简单理解就是i = hash值%模以 数组长度(其实是按位与运算)。如果不同的key都映射到了数组的同一位置处,就将其放入单链表中。且新来的是放在头节点。

2.2 get原理

1.通过hash获得对应数组位置,遍历该数组所在链表(key.equals())

3:hashcode相同,冲突怎么办?

“头插法”,放到对应的链表的头部。

3.1:为什么是头插法(其设计原理是什么)?

因为HashMap的发明者认为,后插入的Entry被查找的可能性更大(因为get查询的时候会遍历整个链表)。

4.hashmap的默认数组长度是多少?

默认为16

4.1 为什么?

之所以选择16,是为了服务于从key映射到index的hash算法(看下面)。

5:hashmap达到默认负载因子(0.75)怎么办?

自动双倍扩容,扩容后重新计算每个键值对位置。且长度必须为16或者2的幂次

5.1为啥要16或者2的幂次?

若不是16或者2的幂次,位运算的结果不够均匀分布,显然不符合Hash算法均匀分布的原则。

反观长度16或者其他2的幂,Length-1的值是所有二进制位全为1,这种情况下,index的结果等同于HashCode后几位的值。只要输入的HashCode本身分布均匀,Hash算法的结果就是均匀的。

6:hashmap是线程安全的吗?

不是。

6.2 为什么?

因为没加锁

6.3 那在并发时会导致什么问题?

hashmap在接近临界点时,若此时两个或者多个线程进行put操作,都会进行resize(扩容)和ReHash(为key重新计算所在位置),而ReHash在并发的情况下可能会形成链表环。

6.4 如何判断有环形表?

最优:首先创建两个指针A和B(在java里就是两个对象引用),同时指向这个链表的头节点。然后开始一个大循环,在循环体中,让指针A每次向下移动一个节点,让指针B每次向下移动两个节点,然后比较两个指针指向的节点是否相同。如果相同,则判断出链表有环,如果不同,则继续下一次循环。

理解:此方法也可以用一个更生动的例子来形容:在一个环形跑道上,两个运动员在同一地点起跑,一个运动员速度快,一个运动员速度慢。当两人跑了一段时间,速度快的运动员必然会从速度慢的运动员身后再次追上并超过,原因很简单,因为跑道是环形的。

7: hashmap 和 hashtable 区别?

线程: 不安全 安全(synchronized修饰)

效率: 更高 略低

数组默认值: 16 11

null值: key-value都允许 不允许(抛异常)

其中key为null的map对象就在索引为0的位置上

8:那hashmap不安全,hashtable性能又低,怎么办?

用concurrenthashmap,即保证安全,性能又可以保障

8.1 那concurrenthashmap究竟是什么?

整个ConcurrentHashMap的结构如下:

理解:hashmap是有entry数组组成,而concurrenthashmap则是Segment数组。那Segment是什么呢?Segment本身就相当于一个HashMap对象。同HashMap一样,Segment包含一个HashEntry数组,数组中的每一个HashEntry既是一个键值对,也是一个链表的头节点。

单一的Segment结构如下(是不是看着就是hashmap):

像这样的Segment对象,在ConcurrentHashMap集合中有多少个呢?有2的N次方个,共同保存在一个名为segments的数组当中。

可以说,ConcurrentHashMap是一个二级哈希表。在一个总的哈希表下面,有若干个子哈希表。(这样类比理解hashmap)

8.2:那他的put和get方法呢(对比hashmap的put和get方法)?

Put方法:

1.为输入的Key做Hash运算,得到hash值。

2.通过hash值,定位到对应的Segment对象

3.获取可重入锁

4.再次通过hash值,定位到Segment当中数组的具体位置。

5.插入或覆盖HashEntry对象。

6.释放锁。

Get方法:

1.为输入的Key做Hash运算,得到hash值。

2.通过hash值,定位到对应的Segment对象

3.再次通过hash值,定位到Segment当中数组的具体位置。

由此可见,和hashmap相比,ConcurrentHashMap在读写的时候都需要进行二次定位。先定位到Segment,再定位到Segment内的具体数组下标。

9: hashmap 和 concurrenthashmap区别?

线程: 不安全 安全

10:为啥concurrenthashmap和hashtable都是线程安全,但是前者性能更高

因为前者是用的分段锁,根据hash值锁住对应链表,当hash值不同时,使其能实现并行插入,效率更高,而hashtable会锁住整个map

当需要put元素的时候,并不是对整个hashmap进行加锁,而是先通过hashcode来知道他要放在那一个分段中,然后对这个分段进行加锁,所以当多线程put的时候,只要不是放在同一个分段中,就实现了真正的并行的插入。

但是,在统计size的时候,就是获取hashmap全局信息的时候,就需要获取所有的分段锁才能统计。

分段锁的设计目的是细化锁的粒度,当操作不需要更新整个数组的时候,就仅仅针对数组中的一部分行加锁操作。

11.java7的hashmap和java8的hashmap的区别(1.8做了哪些优化)?

为了加快查询效率(因为get()需要遍历整张链表),java8的hashmap引入了红黑树结构,当某一链表的元素>8时,该链表就会转成红黑树结构,查询效率更高

相关文章
|
23天前
|
存储 Java 程序员
Java面试加分点!一文读懂HashMap底层实现与扩容机制
本文详细解析了Java中经典的HashMap数据结构,包括其底层实现、扩容机制、put和查找过程、哈希函数以及JDK 1.7与1.8的差异。通过数组、链表和红黑树的组合,HashMap实现了高效的键值对存储与检索。文章还介绍了HashMap在不同版本中的优化,帮助读者更好地理解和应用这一重要工具。
50 5
|
1月前
|
存储 算法 安全
HashMap常见面试题(超全面):实现原理、扩容机制、链表何时升级为红黑树、死循环
HashMap常见面试题:红黑树、散列表,HashMap实现原理、扩容机制,HashMap的jd1.7与jdk1.8有什么区别,寻址算法、链表何时升级为红黑树、死循环
|
3月前
|
安全 Java
【Java集合类面试十五】、说一说HashMap和HashTable的区别
HashMap和Hashtable的主要区别在于Hashtable是线程安全的,不允许null键和值,而HashMap是非线程安全的,允许null键和值。
|
3月前
|
安全 Java
【Java集合类面试十三】、HashMap如何实现线程安全?
实现HashMap线程安全的方法包括使用Hashtable类、ConcurrentHashMap,或通过Collections工具类将HashMap包装成线程安全的Map。
|
3月前
|
Java
【Java集合类面试十一】、HashMap为什么用红黑树而不用B树?
HashMap选择使用红黑树而非B树,是因为红黑树在内存中实现简单,节点更小,占用内存少,且在插入、删除和查找操作上提供更好的平衡性能。
|
3月前
|
安全 Java
【Java集合类面试十六】、HashMap与ConcurrentHashMap有什么区别?
HashMap是非线程安全的,而ConcurrentHashMap通过减少锁粒度来提高并发性能,检索操作无需锁,从而提供更好的线程安全性和性能。
|
3月前
|
Java
【Java集合类面试十四】、HashMap是如何解决哈希冲突的?
HashMap解决哈希冲突的方法是通过链表和红黑树:当链表长度超过一定阈值时,转换为红黑树以提高性能;当链表长度缩小到另一个阈值时,再转换回链表。
|
3月前
|
Java
【Java集合类面试十二】、HashMap为什么线程不安全?
HashMap在并发环境下执行put操作可能导致循环链表的形成,进而引起死循环,因而它是线程不安全的。
|
3月前
|
存储 Java
【Java集合类面试十】、HashMap中的循环链表是如何产生的?
在多线程环境下,HashMap在扩容时如果发生条件竞争,元素的插入顺序可能形成循环链表,导致死循环。
|
3月前
|
存储 Java
【IO面试题 四】、介绍一下Java的序列化与反序列化
Java的序列化与反序列化允许对象通过实现Serializable接口转换成字节序列并存储或传输,之后可以通过ObjectInputStream和ObjectOutputStream的方法将这些字节序列恢复成对象。