HashMap常问面试题

简介: HashMap常问面试题

1 为什么要深入理解HashMap

HashMap的深入考察,必然是面试中的一个核心的点

都是写Java代码,基于Java都是来构建各种各样的系统的,软件的,基于Java写出来一大堆的代码,可能会访问很多其他的东西,数据库,缓存,消息中间件,核心还是来写Java代码实现一些逻辑的运转接收到一个请求,可能会创建一些数据结构,来存放一些数据,做一些循环、跳转、判断、加加减减,数据处理,逻辑,通过一大堆的逻辑就可以完成一些系统功能,或者是软件的功能


HashMap,数据结构,进行一定的逻辑的处理

一句话总结:你是Java工程师,你写代码的时候必然会用到一些数据结构,其中尤为经典的就是HashMap,别人必然会考察你


2 HashMap底层的数据结构是什么吗?

HashMap<String, String> map = new HashMap<String, String>();
map.put(“张三”, “测试数据”);
map.put(“李四”, “测试数据”);
{
   “张三”: “测试数据”,
   “李四”: “测试数据”
}

底层最核心的数据结构并不是你想的这样的数组


对张三计算出来一个hash值,根据这个hash值对数组进行取模,就会定位到数组里的一个元素中去


[<>, <>, <>, <>,<张三, 测试数据>, <>,<>,<李四, 测试数据>,<>, <>, <>, <>,<>, <>, <>, <>]


假设可以放16个元素,取模,

indexarray[4] = <张三, 测试数据>map.get(“张三”) -> hash值 -> 对数组长度进行取模 -> return array[4]


3 JDK 1.8中对hash算法和寻址算法是如何优化的?

hash & (n-1) 和n取模,效果一样(要求数组的长度是2的n次方),但与运算性能好


低16位融合了高16位和低16位的特征,避免了hash冲突

map.put(“张三”, “测试数据”)

对“张三”这个key计算他的hash值,是有一定的优化的


hash算法优化

// JDK 1.8以后的HashMap里面的一段源码
static final int hash(Object key) {
    int h;
    return (key == null) ? 0 : (h = key.hashCode()) ^ (h >>> 16);
}

比如说:有一个key的hash值


1111 1111 1111 1111 1111 1010 0111 1100


0000 0000 0000 0000 1111 1111 1111 1111 (右移16位)


1111 1111 1111 1111 0000 0101 1000 0011 -> int值(代表他hash的一个值),32位 异或运算(不同为1相同为0)


hash值一样 -> 他们其实都会在数组里放在一个位置,进行复杂的hash冲突的处理


[16个元素] -> hash值对数组长度取模,定位到数组的一个位置,塞进去就ok了


高低16位都参与运算


寻址算法优化


(n - 1) & hash -> 数组里的一个位置

1111 1111 1111 1111 1111 1010 0111 1100   `(没有经过优化的hash值)`
1111 1111 1111 1111 0000 0101 1000 0011    `(经过hash算法优化的hash值)`
0000 0000 0000 0000 0000 0000 0000 1111 (15存放的个数是16个)

取模运算,他是性能比较差一些,为了优化这个数组寻址的过程

hash & (n - 1) -> 效果是跟hash对n取模,效果是一样的,但是与运算的性能要比hash对n取模要高很多,数学问题,数组的长度会一直是2的n次方,只要他保持数组长度是2的n次方


hash对n取模的效果 -> hash & (n - 1),效果是一样的,后者的性能更高


1111 1111 1111 1111 1111 1010 0111 1100(没有经过优化的hash值)


0000 0000 0000 0000 0000 0000 0000 1111


而这俩个值的异或操作的结果高16位保持不变,低16位就是原来的低16位与高16位的异或结果。

再来看n-1的值,由于n是2的指数幂,所以不难推出n-1的二进制如下:

0000 0000 0000 0000 0000 0000 0000 0001 //1
0000 0000 0000 0000 0000 0000 0000 0011 //3
0000 0000 0000 0000 0000 0000 0000 0111 //7
0000 0000 0000 0000 0000 0000 0000 1111 //15
0000 0000 0000 0000 0000 0000 0001 1111 //31

相当于,你直接这么搞,高16位之间的与运算,是可以忽略的,核心点在于低16位的与运算,hash值的高16位没有参与到与运算里来啊


假设有两个hash值

显然,在数据量不多的情况下,n-1的高16位都是0,而与0做按位与结果还是0,相当于将hash值的高16位忽略掉了。

那么hash值若是存在高16位不同,而低16位完全相同的数时,就会因为n-1的特性导致对俩个完全不同的hash值取模结果却相同,产生大量的hash冲突。例如:

1111 0011 1010 1111 0101 0101 0101 0101  //hash值1
1100 1100 1010 1100 0101 0101 0101 0101  //hash值2

因此对hash算法的优化就是为了让hashCode的高低位都参与取模,降低冲突概率。


配合起来讲


hash算法的优化:对每个hash值,在他的低16位中,让高低16位进行了异或,让他的低16位同时保持了高低16位的特征,尽量避免一些hash值后续出现冲突,大家可能会进入数组的同一个位置


寻址算法的优化:用与运算替代取模,提升性能


4 HashMap是如何解决hash碰撞问题的吗?

hash冲突问题,链表+红黑树,O(n)和O(logn)

map.put和map.get -> hash算法优化(避免hash冲突),寻址性能优化

算出key的hash值,到数组中寻址,找到一个位置,把key-value对放进数组,或者从数组里取出来

两个key,多个key,他们算出来的hash的值,与n-1,与运算之后,发现定位出来的数组的位置还是一样的,hash碰撞,hash冲突


[<> -> <> -> <>, ]


array[0]这个位置,就是一个链表

会在这个位置挂一个链表,这个链表里面放入多个元素,让多个key-value对,同时放在数组的一个位置里get,如果定位到数组里发现这个位置挂了一个链表,此时遍历链表,从里面找到自己的要找的那个key-value对就可以了

假设你的链表很长,可能会导致遍历链表,性能会比较差,O(n)

优化,如果链表的长度达到了一定的长度之后,其实会把链表转换为红黑树,遍历一颗红黑树找一个元素,此时O(logn),性能会比链表高一些


5 HashMap是如何进行扩容的可以吗?

底层是一个数组,当这个数组满了之后,他就会自动进行扩容,变成一个更大的数组,让你在里面可以去放更多的元素


2倍扩容


[16位的数组,<> -> <> -> <>]


[32位的数组,<> -> <>, <>]


数组长度=16


n - 1 0000 0000 0000 0000 0000 0000 0000 1111


hash1 1111 1111 1111 1111 0000 1111 0000 0101


&结果 0000 0000 0000 0000 0000 0000 0000 0101 = 5(index = 5的位置)


n - 1 0000 0000 0000 0000 0000 0000 0000 1111


hash2 1111 1111 1111 1111 0000 1111 0001 0101


&结果 0000 0000 0000 0000 0000 0000 0000 0101 = 5(index = 5的位置)


在数组长度为16的时候,他们两个hash值的位置是一样的,用链表来处理,出现一个hash冲突的问题


如果数组的长度扩容之后 = 32,重新对每个hash值进行寻址,也就是用每个hash值跟新数组的length - 1进行与操作


n-1 0000 0000 0000 0000 0000 0000 0001 1111


hash1 1111 1111 1111 1111 0000 1111 0000 0101


&结果 0000 0000 0000 0000 0000 0000 0000 0101 = 5(index = 5的位置)


n-1 0000 0000 0000 0000 0000 0000 0001 1111


hash2 1111 1111 1111 1111 0000 1111 0001 0101


&结果 0000 0000 0000 0000 0000 0000 0001 0101 = 21(index = 21的位置)


判断二进制结果中是否多出一个bit的1,如果没多,那么就是原来的index,如果多了出来,那么就是index + oldCap,通过这个方式,就避免了rehash的时候,用每个hash对新数组.length取模,取模性能不高,位运算的性能比较高


6 HashMap和HashTable的区别

HashMap是线程不安全的,在多线程并发的环境下,可能会产生死锁等问题,因此需要开发人员自己处理多线程的安全问题。Hashtable是线程安全的,它的每个方法上都有synchronized 关键字,因此可直接用于多线程中。虽然HashMap是线程不安全的,但是它的效率远远高于Hashtable,这样设计是合理的,因为大部分的使用场景都是单线程。当需要多线程操作的时候可以使用线程安全的ConcurrentHashMap。ConcurrentHashMap虽然也是线程安全的,但是它的效率比Hashtable要高好多倍。因为ConcurrentHashMap使用了分段锁,并不对整个数据进行锁定。

目录
相关文章
|
6月前
|
存储 缓存 安全
面试题-HashMap底层原理与HashTable的区别
字节跳动面试题-HashMap底层原理与HashTable的区别
60 0
|
26天前
|
存储 算法 安全
HashMap常见面试题(超全面):实现原理、扩容机制、链表何时升级为红黑树、死循环
HashMap常见面试题:红黑树、散列表,HashMap实现原理、扩容机制,HashMap的jd1.7与jdk1.8有什么区别,寻址算法、链表何时升级为红黑树、死循环
|
3月前
|
存储 安全 Java
一天十道Java面试题----第二天(HashMap和hashTable的区别--------》sleep、wait、join)
这篇文章是关于Java面试的第二天笔记,涵盖了HashMap与HashTable的区别、ConcurrentHashMap的实现原理、IOC容器的实现方法、字节码的概念和作用、Java类加载器的类型、双亲委派模型、Java异常体系、GC如何判断对象可回收、线程的生命周期及状态,以及sleep、wait、join、yield的区别等十道面试题。
一天十道Java面试题----第二天(HashMap和hashTable的区别--------》sleep、wait、join)
|
3月前
|
安全 Java
【Java集合类面试十五】、说一说HashMap和HashTable的区别
HashMap和Hashtable的主要区别在于Hashtable是线程安全的,不允许null键和值,而HashMap是非线程安全的,允许null键和值。
|
4月前
|
存储 安全 Java
Java面试题:请解释Java内存模型,并说明如何在多线程环境下使用synchronized关键字实现同步,阐述ConcurrentHashMap与HashMap的区别,以及它如何在并发环境中提高性能
Java面试题:请解释Java内存模型,并说明如何在多线程环境下使用synchronized关键字实现同步,阐述ConcurrentHashMap与HashMap的区别,以及它如何在并发环境中提高性能
36 0
|
5月前
|
消息中间件 存储 缓存
面试题--HashMap和TreeMap的区别和应用场景有啥区别?
然后底层调用key的hashCode()方法得出hash值; 过哈希表哈希算法,将hash值转换成数组的下标(注1),下标位置上如果没有任何元素,就把Node添加到这个位置上。如果说下标对应的位置上有值。此时,就会拿着key和链表上每个节点的key进行equal。如果所有的equals方法返回都是false,那么这个新的节点将被添加到链表的末尾。如其中有一个equals返回了true,那么这个节点的value将会被覆盖,如果最终长度大于8就会转成红黑树,红黑树插入;
42 3
|
6月前
|
存储 算法 Java
如果面试也能这样说HashMap,那么就不会有那么多遗憾!(中)
如果面试也能这样说HashMap,那么就不会有那么多遗憾!
46 0
|
5月前
|
存储 安全 Java
《ArrayList & HashMap 源码类基础面试题》面试官们最喜欢问的ArrayList & HashMap源码类初级问,你都会了?
《ArrayList & HashMap 源码类基础面试题》面试官们最喜欢问的ArrayList & HashMap源码类初级问,你都会了?
38 0
|
6月前
|
Python
2024年Python最新刷爆全网的动态条形图,原来5行Python代码就能实现!,2024年最新Python面试必问的HashMap
2024年Python最新刷爆全网的动态条形图,原来5行Python代码就能实现!,2024年最新Python面试必问的HashMap
2024年Python最新刷爆全网的动态条形图,原来5行Python代码就能实现!,2024年最新Python面试必问的HashMap
|
6月前
|
存储 算法 Java
耗时3天写完的HashMap万字解析,争取一篇文章讲透它,面试官看了都直点头!
耗时3天写完的HashMap万字解析,争取一篇文章讲透它,面试官看了都直点头!
90 3