哈希表
- 诞生的前提
- 在线性表、树等数据结构中,记录在结构中的相对位置是随机的,和记录的关键字之间不存在确定的关系,因此, 在结构中查找记录时需要进行一系列和关键字的比较。此类的查找方法建立在"比较"的基础上。
- 在顺序查找时,比较的结果为等于 与 不等于两种可能;
- 在折半查找中、二叉排序树查找和B-树查找时,比较的结果为小于、等于、和大于三种可能;
- 查找的效率依赖于查找过程中所进行的比较次数。
- 在线性表、树等数据结构中,记录在结构中的相对位置是随机的,和记录的关键字之间不存在确定的关系,因此, 在结构中查找记录时需要进行一系列和关键字的比较。此类的查找方法建立在"比较"的基础上。
- 定义:
- 理想的情况,希望不经过任何比较,一次存取便能得到所查记录,那就必须在记录的存储位置和它的关键字之间建立一个确定的对应关系f, 使每个关键字和结构中一个唯一的存储位置相对应。因而在查找时,只要根据这个对应关系f找到给定值K的像f(K)。若结构中存在关键字和K相等的记录,则必定在f(K)的存储位置上,由此,不需要进行比较便可直接取得所查记录。这个对应关系f为哈希函数,按这个思想建立的表为哈希表。
- 理解:
- 1、哈希函数是一个映像,因此哈希函数的设定比较灵活,只要使的任何关键字由此所得的哈希函数值都落在表长允许范围之内即可。
- 2、对不同的关键字可能得到同一哈希地址,即key1不等于key2,但是f(key1)等于f(key2),这种现象称为冲突。
- 3、具有相同函数值的关键字对该哈希函数来说称做同义词。
- 在一般情况下,冲突只能尽可能地少,而不能完全避免。因为,哈希函数是从关键字集合到地址集合的映像。通常,关键字集合比较大,它的元素包括所有可能的关键字,而地址集合的元素仅为哈希表中的地址值。假设表长为n,则地址为0到n-1。
- 在一般情况下,哈希函数是一个压缩映像,这就不可避免产生冲突。(也就是说,关键字集合远远大于地址结合)
- 总结:
- 根据设定的哈希函数H(key)和处理冲突的方法将一组关键字映像到一个有限的连续的地址集(区间)上,并以关键字在地址集中的“像”作为记录在表中的存储位置,这种表称为哈希表,这一映像的过程称为散列,所得存储位置称哈希地址或散列地址。
- 构造哈希的方法:
- 1、直接定址法
- 2、数字分析法
- 3、平方取中法
- 4、折叠法
- 5、除留余数法
- 在实际工作中,选择考虑的因素:
- 1、 计算哈希函数所需时间(包括硬件指令的因素);
- 2、关键字的长度;
- 3、哈希表的大小;
- 4、关键字的分布情况;
- 5、记录的查找频率。
- 处理哈希冲突的方法
- 1、开放定址法
- 2、再哈希法
- 3、链地址法
- 4、建立一个公共溢出区