哈希冲突详解

简介: 哈希冲突详解

哈希冲突详解


一般来说哈希冲突有两大类解决方式


  1. Separate chaining
  2. Open addressing


Java 中采用的是第一种 Separate chaining,即在发生碰撞的那个桶后面再加一条“链”来存储,那么这个“链”使用的具体是什么数据结构,不同的版本稍有不同:


在 JDK1.6 和 1.7 中,是用 链表存储的,这样如果碰撞很多的话,就变成了在链表上的查找,worst case 就是 O(n);

在 JDK 1.8 进行了优化,当链表长度较大时(超过 8),会采用红黑树来存储,这样大大提高了查找效率。


(话说,这个还真的喜欢考,已经在多次面试中被问过了,还有面试官问为什么是超过“8”才用红黑树🤔)


image.png


第二种方法 open addressing 也是非常重要的思想,因为在真实的分布式系统里,有很多地方会用到 hash 的思想但又不适合用 seprate chaining


这种方法是顺序查找,如果这个桶里已经被占了,那就按照“某种方式”继续找下一个没有被占的桶,直到找到第一个空的。


image.png


如图所示,John Smith 和 Sandra Dee 发生了哈希冲突,都被计算到 152 号桶,于是 Sandra 就去了下一个空位 - 153 号桶,当然也会对之后的 key 发生影响:Ted Baker 计算结果本应是放在 153 号的,但鉴于已经被 Sandra 占了,就只能再去下一个空位了,

所以到了 154 号。


这种方式叫做 Linear probing 线性探查,就像上图所示,一个个的顺着找下一个空位。当然还有其他的方式,比如去找平方数,或者 Double hashing.


如果你喜欢这篇文章,记得给我点赞留言哦~你们的支持和认可,就是我创作的最大动力,我们下篇文章见!


我是小齐,纽约程序媛,终生学习者,每天晚上 9 点,云自习室里不见不散!

目录
相关文章
|
存储 NoSQL 大数据
【MongoDB 专栏】MongoDB 在大数据场景下的应用
【5月更文挑战第11天】MongoDB,适用于大数据时代,以其灵活数据模型、高可扩展性和快速性能在大数据场景中脱颖而出。它处理海量、多类型数据,支持高并发,并在数据分析、日志处理、内容管理和物联网应用中广泛应用。电商和互联网公司的案例展示了其在扩展性和业务适应性上的优势,但同时也面临数据一致性、资源管理、数据安全和性能优化的挑战。
1176 1
【MongoDB 专栏】MongoDB 在大数据场景下的应用
|
Python
详解历时五年的 Cython3.0 都发生了哪些变化(一)
详解历时五年的 Cython3.0 都发生了哪些变化(一)
264 1
|
11月前
|
人工智能 Cloud Native 关系型数据库
双位数增长,阿里云连续五年领跑关系型数据库
阿里云蝉联中国关系型数据库整体市场份额第一,在公有云业务双位数增长的驱动下,阿里云同时在公有云关系型数据库市场取得了38%的市场份额,连续五年位居首位。
|
存储 安全 数据安全/隐私保护
数据传输中遇到问题要怎么解决
在数据传输中遇到问题时,可采取多种解决方案:使用可靠协议(如HTTPS、SFTP)、创建冗余备份、数据压缩与加密、错误检测与纠错、优化网络性能、解决数据丢失、降低延迟、提高安全性及解决带宽瓶颈。这些措施有助于确保数据传输的稳定、安全与高效。
|
存储 网络协议 Linux
2.10 高性能异步IO机制:io_uring
2.10 高性能异步IO机制:io_uring
1253 0
|
大数据 数据挖掘
大数据中配对删除(Pairwise Deletion)
【10月更文挑战第22天】
513 6
|
机器学习/深度学习 PyTorch 测试技术
Ultralytics YOLOv5简介
Ultralytics YOLOv5简介
|
机器学习/深度学习
【Python-Keras】keras.layers.BatchNormalization解析与使用
BatchNormalization是一种用于深度神经网络的规范化方法,通过在每个batch上规范化前一层的激活值,加快模型训练速度,提高稳定性,并减少对初始化权重的敏感性,允许使用更大的学习率。
361 1
|
SQL 安全 Java
MyBatis LambdaQueryWrapper的概念以及具备那些写法
【4月更文挑战第2天】MyBatis是一个流行的Java持久层框架,它提供了与数据库交互的简化方法。而MyBatis Plus是一个在MyBatis基础上的增强工具,它引入了很多便利的特性,其中之一就是LambdaQueryWrapper。这个类是一个基于Java 8的Lambda表达式的查询构造器,使得构建查询语句变得更加简洁和类型安全。
547 3
|
数据采集 弹性计算 供应链
付费类型选择全解析:包年包月、按量付费和抢占式实例
阿里云服务器付费模式包括包年包月、按量付费和抢占式实例。包年包月适合长期稳定使用,价格优惠,支持备案;按量付费适合短期或波动需求,按小时计费;抢占式实例价格低廉但可能被系统自动释放,适合无状态应用。选择时考虑业务需求的稳定性和资源成本。更多详情见阿里云官方文档。
439 0