备战2022春招或暑期实习,祝大家每天进步亿点点!Day4
本篇总结的是 《如何正确的重写hashcode()》,后续会每日更新~
关于《Redis入门到精通》、《并发编程》等知识点可以参考我的往期博客:《Redis从入门到精通》系列 《并发编程》系列
相信自己,越活越坚强,活着就该逢山开路,遇水架桥!生活,你给我压力,我还你奇迹!所以当我们的类未重写hashcode方法,且类的其余超类也未重写;那么我们在调用hashcode方法时,它将永远返回的是对象的内存地址。这可能不是你想要的结果,那我们如何来重写它呢?
思路
首先我们需要知道,我们是通过对象的域来计算hash的,在对象中域无非数组、引用类型、基本数据类型,有这么多类型的域,我们肯定不能选择某一个域的hash值来作为对象的hashcode方法的返回值;因此我们考虑将域的hash值累加起来返回!
基本数据类型,大家可以参考其对应的包装类型的hashcode方法
引用类型则直接调用hashcode()
数组类型则需要遍历数组,依次调用hashcode()
通用实现
这是java.util.Objects提供的hash方法,用于计算hashcode。虽然这个不是一个计算hashcode的银弹,但是我们可以借鉴这种实现,而且Java JDK源码中大部分类的hashcode都是类似这种实现方式!
这个方法大致可以分为两步:
如果a==null,则返回hashcode为0
如果a != null,则遍历每一个域,域不为null,则调用域的hashcode方法并累加
这其中有一个非常显眼的数字 31,每次循环时会将当前result31,这是为什么呢?
其实每次计算result*31的作用是为了,防止hash冲突!因为如果不设置一个乘积因子,result计算的结果比较小,非常容易在累加的过程后出现相同的hash值,这种情况不是我们想见到的!
那为什么是31呢?31为什么能成为JDK计算团队选中的真命天子,就不能是2?不能是1001?
其实使用31作为乘积因子是有原因的,其原因小捌觉得有三点:
31是一个不大不小的数,它不会过小导致hashcode计算的结果容易发生冲突;因为返回值是一个int整数类型也不至于过大,导致hashcode返回值溢出。
31是一个奇数,一个数与奇数相乘,不容易丢失低位;因为乘以2相当于无符号左移一位,这样会在低位补0,这样的话hashcode计算的值,就非常容易冲突了。
31对虚拟机的识别非常友好,对于虚拟机来说31 = 2^5 - 1,他能针对这种数字做优化并转换为位运算,因此相乘的时候性能较好
小捌在这里分别用乘积因子2和乘积因子31做个测试:
package com.liziba.part2; import org.apache.commons.lang3.RandomStringUtils; import java.util.ArrayList; import java.util.Comparator; import java.util.List; import java.util.Objects; /** * <p> * HashCode方法测试 * </p> * * @Author: Liziba * @Date: 2021/10/24 11:54 */ public class HashCodeMethodDemo { /** * 计算hashcode * * @param value 需计算hashcode字符串 * @param capacity 乘数因子 * @return */ public static int hashCode(String value, int capacity) { int hash = 0; if (Objects.nonNull(value) && value.length() > 0) { char[] chars = value.toCharArray(); for (int i = 0; i < chars.length; i++) { hash = capacity * hash + chars[i]; } } return hash; } /** * hash值冲突比较 * * @param capacity * @param hashValues */ public static void conflictCompare(int capacity, List<Integer> hashValues) { Comparator<Integer> comparator = (x, y) -> (x > y) ? 1 : ((x < y) ? -1 : 0); Integer max = hashValues.stream().max(comparator).get(); Integer min = hashValues.stream().min(comparator).get(); long conflictNum = hashValues.size() - hashValues.stream().distinct().count(); double conflictRate = conflictNum * 1.0 / hashValues.size() ; System.out.println(String.format("乘数因子capacity=%d 冲突数=%d 冲突率:%.4f%% 最大值:%d 最小hashCode:%d", capacity, conflictNum, conflictRate * 100, max, min)); } public static void main(String[] args) { int num = 100000; int capacity2 = 2; int capacity31 = 31; List<Integer> hashValues2 = new ArrayList<>(num); List<Integer> hashValues31 = new ArrayList<>(num); for (int i = 0; i < num; i++) { // 生成随机数 org.apache.commons.lang3.RandomStringUtils String value = RandomStringUtils.randomAlphabetic(15); hashValues2.add(hashCode(value, capacity2)); hashValues31.add(hashCode(value, capacity31)); } conflictCompare(capacity2, hashValues2); conflictCompare(capacity31, hashValues31); } }