数据结构第十一周笔记 —— 散列查找系列 2 (慕课浙大版本 --XiaoYu)

简介: 散列函数的构造方法

11.2 散列函数的构造方法

11.2.1 数字关键词的散列函数构造

一个"好"的散列函数一般应考虑下列两个因素:

  1. 计算简单,以便提高转换速度
  2. 关键词对应的地址空间分布均匀,以尽量减少冲突

数字关键词的散列函数构造

  1. 直接定址法:取关键词的某个线性函数值为散列地址,即h(key) = a×key+b (a、b为常数)
    网络异常,图片无法展示
    |

  2. 除留余数法(常用)://其实就是把一个大的整数把它转换成一个小的整数,这个小的整数就相当于散列表里面的地址
  1. 散列函数为:h(key) = key mod p
    网络异常,图片无法展示
    |

  1. 数字分析法:分析数字关键字在各位上的变化情况,取比较随机的位作为散列地址
  1. 比如:取11位收集号码key的后4位作为地址:散列函数为:h(key)=atoi(key+7)(char*key)
    网络异常,图片无法展示
    |

  2. int atoi(char*s):将类似"5678"的字符串转换为整数5678
  3. 如果关键词key是18位的身份证号码:
    网络异常,图片无法展示
    |

  4. 网络异常,图片无法展示
    |

  1. 折叠法:把关键词分割成位数相同的几个部分,然后叠加
    网络异常,图片无法展示
    |

  2. 平方取中法:
    网络异常,图片无法展示
    |

如果仅改变56793542的最后一位,观察散列值会有什么变化(原散列值为641)。

请计算一下,按照平方取中法,key为56793543的散列值是多少=652

11.2.2 字符串关键词的散列函数构造

字符关键词的散列函数构造

  1. 一个简单的散列函数——ASCII码加和法(ASCII码相加在求个余数)
  1. 网络异常,图片无法展示
    |

  2. 假如每个字符的变化范围在0-127,我们把它∑起来,∑后的值在0-1270之间,而变量名实际上的这种变化是非常多的,如果以很窄的计算结果来对付一个很广的这个变量范围就会使得这样的一个哈希函数很容易产生聚集,所以这不是一个很好的办法
  1. 简单的改进——前3个字符移位法
  1. h(key)=(key[0] x 27² + key[1] x 27 + key[2])mod TableSize
  2. 这种方法仍然会产生冲突:string、street、strong、structure等等(前三位是一样的);空间浪费:3000/26³≈30
  3. 空间浪费原因:字符一共有26种变化,所以三个字符的变化一共就26的三次方。而前三位一般出现的情况是3000种,而我们实际上考虑到26³去了,通过上面可以知道浪费的空间足足有30倍
  1. 好的散列函数——移位法
  1. 网络异常,图片无法展示
    |

  2. 将数值巨大化,采用32进制相乘
    网络异常,图片无法展示
    |

  3. 优化方法:(a32+b) =>((a32+b)32+c)=>(((a32+b)32+c)32+d)

如果直接计算'a'*32^4+'b'*32^3+'c'*32^2+'d'*32+'e'所需要的乘法总次数是4+3+2+1=10次。

采用 ((('a'*32+'b')*32+'c')*32+'d')*32+'e'的计算方法,乘法总次数是多少?

(顺便思考一下两者时间效率的差别)4

IndexHash(constchar*Key,intTableSize)

{

   unsignedinth=0;//散列函数值,初始化为0

   while(*Key!=‘\0’)//位移映射,这里就是值不为空的意思

       h= ( h<<5 ) +*Key++;//h << 5是左移五位的意思

   returnh%TableSize;//最后求余得到地址

}


目录
相关文章
|
6月前
|
存储 算法
【单向链表】数据结构——单向链表的介绍与代码实现&笔记
【单向链表】数据结构——单向链表的介绍与代码实现&笔记
|
6月前
|
存储 算法
【树】数据结构——树和二叉树的概念&笔记
【树】数据结构——树和二叉树的概念&笔记
|
5月前
|
存储 算法 C语言
软考中级之数据库系统工程师笔记总结(二)数据结构与算法
软考中级之数据库系统工程师笔记总结(二)数据结构与算法
41 0
|
6月前
|
存储 算法 Linux
【内核链表】数据结构——深入理解内核链表的概念和操作&笔记
【内核链表】数据结构——深入理解内核链表的概念和操作&笔记
【循环链表】数据结构——单向循环链表和双向循环链表操作&笔记
【循环链表】数据结构——单向循环链表和双向循环链表操作&笔记
|
1月前
|
C语言
【数据结构】栈和队列(c语言实现)(附源码)
本文介绍了栈和队列两种数据结构。栈是一种只能在一端进行插入和删除操作的线性表,遵循“先进后出”原则;队列则在一端插入、另一端删除,遵循“先进先出”原则。文章详细讲解了栈和队列的结构定义、方法声明及实现,并提供了完整的代码示例。栈和队列在实际应用中非常广泛,如二叉树的层序遍历和快速排序的非递归实现等。
185 9
|
1月前
|
存储 算法
非递归实现后序遍历时,如何避免栈溢出?
后序遍历的递归实现和非递归实现各有优缺点,在实际应用中需要根据具体的问题需求、二叉树的特点以及性能和空间的限制等因素来选择合适的实现方式。
32 1
|
23天前
|
存储 缓存 算法
在C语言中,数据结构是构建高效程序的基石。本文探讨了数组、链表、栈、队列、树和图等常见数据结构的特点、应用及实现方式
在C语言中,数据结构是构建高效程序的基石。本文探讨了数组、链表、栈、队列、树和图等常见数据结构的特点、应用及实现方式,强调了合理选择数据结构的重要性,并通过案例分析展示了其在实际项目中的应用,旨在帮助读者提升编程能力。
44 5
|
1月前
|
存储 算法 Java
数据结构的栈
栈作为一种简单而高效的数据结构,在计算机科学和软件开发中有着广泛的应用。通过合理地使用栈,可以有效地解决许多与数据存储和操作相关的问题。
|
1月前
|
存储 JavaScript 前端开发
执行上下文和执行栈
执行上下文是JavaScript运行代码时的环境,每个执行上下文都有自己的变量对象、作用域链和this值。执行栈用于管理函数调用,每当调用一个函数,就会在栈中添加一个新的执行上下文。