数据结构和算法——散列表的性能分析(开放地址法的查找性能、期望探测次数与装填因子的关系、分离链接法的查找性能)

简介: 数据结构和算法——散列表的性能分析(开放地址法的查找性能、期望探测次数与装填因子的关系、分离链接法的查找性能)

散列表的性能分析

  • 平均查找长度(ASL)用来度量散列表查找效率:成功、不成功
  • 关键词的比较次数,取决于产生冲突的多少,影响产生冲突多少有以下三个因素
  1. 散列函数是否均匀;
  2. 处理冲突的方法;
  3. 散列表的装填因子


开放地址法的查找性能

线性探测法

可以证明,线性探测法的期望探测次数满足下列公式:

(对插入和不成功查找而言)

(对成功查找而言)


时,

  • 插入操作和不成功查找的期望
  • 成功查找的期望

在实际问题中,


1717670908383.png


,于是,经过公式计算得:

ASLu=5.70次,ASLs=2.11(实际计算ASLs=2.56)

平方探测法和双散列探测法

可以证明,平方探测法和双散列探测法探测次数满足下列公式:

(对插入和不成功查找而言)

(对成功查找而言)



时,

  • 插入操作和不成功查找的期望
  • 成功查找的期望

在实际问题中,


1717670943450.png

,于是,通过公式计算得:

ASLu=5.56次,ASLs=2.09次(实际计算ASLs=2)。

期望探测次数与装填因子的关系


  • 当装填因子 的时候,各种探测法的期望探测次数都不大,也比较接近。
  • 随着 的增大,线性探测法的期望探测次数增加较快,不成功查找和插入操作的期望探测次数比成功查找的期望探测次数要大
  • 合理的最大装填因子应该不超过0.85

分离链接法的查找性能

所有地址链表的平均长度定义成装填因子 有可能超过1。

不难证明:其期望探测次数p为:

(对插入和不成功查找而言)

(对成功查找而言)



时,

  • 插入操作和不成功查找的期望
  • 成功查找的期望

在实际问题中,

前面例子14个元素分布在11个单链表中,所以 ,故

期望ALSu=1.55次,ASLs=1.64次(实际计算ASLs为1.36).

总结

  • (优点)选择合适的h(key),散列表的查找效率期望是常数O(1),它几乎与关键字的空间的大小n无关!也适合于关键字直接比较计算量大的问题
  • 它是以较小的为前提。因此,散列方法是以空间换时间
  • (缺点)散列方法的存储对关键字是随机的,不便于顺序查找关键字,也不适用与范围查找,或最大值最小值查找。

开放地址法

  • (优点)散列表是一个数组,存储效率高,随机查找
  • (缺点)散列表有“聚集”现象

分离链接法

  • 散列表顺序存储和链式存储的结合,链表部分的存储效率和查找效率都比较低
  • (优点)关键字删除不需要“懒惰删除”法,从而没有存储“垃圾”
  • (缺点)太小的 可能导致空间浪费,大的 又将付出更多的时机代价。不均匀的链表长度导致时间效率的严重下降。
目录
相关文章
|
存储 算法 C语言
"揭秘C语言中的王者之树——红黑树:一场数据结构与算法的华丽舞蹈,让你的程序效率飙升,直击性能巅峰!"
【8月更文挑战第20天】红黑树是自平衡二叉查找树,通过旋转和重着色保持平衡,确保高效执行插入、删除和查找操作,时间复杂度为O(log n)。本文介绍红黑树的基本属性、存储结构及其C语言实现。红黑树遵循五项基本规则以保持平衡状态。在C语言中,节点包含数据、颜色、父节点和子节点指针。文章提供了一个示例代码框架,用于创建节点、插入节点并执行必要的修复操作以维护红黑树的特性。
418 1
|
并行计算 算法 测试技术
C语言因高效灵活被广泛应用于软件开发。本文探讨了优化C语言程序性能的策略,涵盖算法优化、代码结构优化、内存管理优化、编译器优化、数据结构优化、并行计算优化及性能测试与分析七个方面
C语言因高效灵活被广泛应用于软件开发。本文探讨了优化C语言程序性能的策略,涵盖算法优化、代码结构优化、内存管理优化、编译器优化、数据结构优化、并行计算优化及性能测试与分析七个方面,旨在通过综合策略提升程序性能,满足实际需求。
518 1
crash —— 获取内核地址布局、页大小、以及栈布局
crash —— 获取内核地址布局、页大小、以及栈布局
|
JSON NoSQL MongoDB
MongoDB Schema设计实战指南:优化数据结构,提升查询性能与数据一致性
【8月更文挑战第24天】MongoDB是一款领先的NoSQL数据库,其灵活的文档模型突破了传统关系型数据库的限制。它允许自定义数据结构,适应多样化的数据需求。设计MongoDB的Schema时需考虑数据访问模式、一致性需求及性能因素。设计原则强调简洁性、查询优化与合理使用索引。例如,在构建博客系统时,可以通过精心设计文章和用户的集合结构来提高查询效率并确保数据一致性。正确设计能够充分发挥MongoDB的优势,实现高效的数据管理。
502 3
|
存储 算法 调度
惊呆了!Python高级数据结构堆与优先队列,竟然能这样优化你的程序性能!
【7月更文挑战第10天】Python的heapq模块实现了堆和优先队列,提供heappush和heappop等函数,支持O(log n)时间复杂度的操作。优先队列常用于任务调度和图算法,优化性能。例如,Dijkstra算法利用最小堆加速路径查找。堆通过列表存储,内存效率高。示例展示了添加、弹出和自定义优先级元素。使用堆优化程序,提升效率。
230 2
crash —— 查看数据结构内部成员的偏移量和地址
crash —— 查看数据结构内部成员的偏移量和地址
|
算法 Python
【Leetcode刷题Python】改进的算法,高效求一个数的因子
一个高效的Python函数用于找出一个整数的所有因子,通过仅遍历到该数平方根的范围来优化性能。
162 0
|
机器学习/深度学习 运维 算法
Python基于局部离群因子LOF算法(LocalOutlierFactor)实现信用卡数据异常值检测项目实战
Python基于局部离群因子LOF算法(LocalOutlierFactor)实现信用卡数据异常值检测项目实战
|
4月前
|
机器学习/深度学习 算法 机器人
【水下图像增强融合算法】基于融合的水下图像与视频增强研究(Matlab代码实现)
【水下图像增强融合算法】基于融合的水下图像与视频增强研究(Matlab代码实现)
421 0
|
4月前
|
数据采集 分布式计算 并行计算
mRMR算法实现特征选择-MATLAB
mRMR算法实现特征选择-MATLAB
294 2

热门文章

最新文章