⭐⭐⭐初印象🌙🌙🌙:
初识HashMap时,知道HashMap是用来存放Key-Value这样的键值对的,也知道HashMap的底层数据结构是:数组+链表+红黑树,且数组长度为2的x次幂。
⭐⭐⭐疑问🌙🌙🌙:
那么往HashMap中添加键值对时,是什么决定了键值对的存放位置呢?即存放位置是如何计算出来的呢?相同的疑问可能还会以下面的问题描述方式提出来:
其他描述方式:
1.向HashMap中put数据时,数据是如何找到HashMap中Node[] table数组的对应索引下标位置的?
2.HashMap在put时是如何找到要存放的数组索引下标的位置的?键值对是如何与数组索引下标产生映射关联关系的?
比如有个HashMap的数组中有16个索引下标位置,一个数据过来要put到HashMap中,是谁来决定该元素会被分配到具体哪个索引下标位置的?如何保证哪块代码处理的?
⭐⭐⭐分析🌙🌙🌙:
既然是由put方法引出的问题,自然要到put的源代码里找寻线索。当我们认真研读put的源码时会发现下面这三段代码,我们分别解读一下:
- put调用putVal方法:
public V put(K key, V value) {
return putVal(hash(key), key, value, false, true);
} - 根据Key-键值计算出新的哈希码值:
static final int hash(Object key) {
int h;
return (key == null) ? 0 : (h = key.hashCode()) ^ (h >>> 16);
}
这段代码里首先调用Object的hashCode()方法,计算出key的原始哈希码;
然后,将原始哈希码无符号右移了16位,即高16位被移到了低16位(
问1:为啥做无符号右移操作,即为啥要从高位往低位移动呢?移动后又为何要做异或操作?
答1:低位不确保有没有1,但高位肯定有1,拿无符号右移后的值与原值做异或操作,可以得到一个1的分布在高低位相对更加均匀的结果。(为啥要得到这样的结果呢?是为了在跟数组长度一起做&与运算计算索引下标时,得到相对更加均匀分撒的结果,这样根据不同key得出的数组索引下标尽可能分撒的话,就不容易发生哈希碰撞,也就降低了一开始往HashMap中添加数据时链表的产生几率)
问2:为啥又非得是16位呢?
答2:因为hashCode是一个int整形32位,高16位无符号右移16位,可以保证高位与低位能充分混合,这样的话,再拿无符号右移后的值与原值做异或操作,可以使得1在高低位的分布更加均匀。
)
然后无符号右移后的值与原哈希码值做异或操作,得到一个1的分布在高低位相对更加均匀的新哈希码值。 - 根据数组长度及新哈希码计算索引位置:
在put调用的putVal方法的里,有这么一段代码:
final V putVal(int hash, K key, V value, boolean onlyIfAbsent, boolean evict) {
Node[] tab; Node p; int n, i;
if ((tab = table) == null || (n = tab.length) == 0)
n = (tab = resize()).length;
if ((p = tab[i = (n - 1) & hash]) == null)
………………………………后续代码省略…………………………………………
注意第2个if语句里隐藏了这么一句:p = tab[i = (n - 1) & hash]
这里就是根据数组长度和新哈希码值计算数组下标的地方,其中:
tab从第三段代码可以看到是从table得来的,而table就是HashMap中的存放链表头节点的数组:Node table;
n是数组的长度,为2的x次幂的数,故(n-1)代表的二进制位全是1;
hash是从第二段代码中得到的新哈希值
由上可以进而推导出,在公式(n-1)&hash中:
当hash全为0时,得到最小值为0;
当hash全为1时,得到最大值为(n-1);
当hash部分为0部分为1时,得到介于最大值和最小值之间的整数;
这样就确保了,根据就根据key得到了要存放的数组索引下标,而且该下标肯定会落在数组长度对应的索引范围内。