在理想情况下,我们希望不经过任何比较,一次存取便能得到所查的记录,那就必须在记的存储位置和它的关键字之间建立一个确定的对应关系,使每个关键字和一个唯一的存储位置对应,因而在查找时候,根据这个对应关系与找到对应的值K的像f(K).由此,不需要进行比较便可以直接取得所查结果。在此,我们称这个对应关系是hash函数,按这个思想建立的表为hash表。
在hash表中,对于不同的关键字可能得到同一个hash地址,这种现象称为冲突。
hash tree算法就是要提供一种在理论上和实际应用中都可以有效的处理冲突的方式,一般的hash算法都是O(1)的,而且基本是以空间换区时间。这很容易导致对存储空间的无限制的需求。
理论基础:n个不同的质数可以分辨连续整数的个数和他们的乘机相等。
利用质数分辨法建立哈希表:从2开始到n个质数建立n层hashtree 对质数进行取余决定了处理路径,结点中有一标志位标注这个结点是否有效。
优点:1、结构简单。2、查找迅速,查找次数和元素个数无关,仅与层数有关。3、结构不变,删除时,仅仅改变标志位,不做物理删除。
缺点:非排序性,hash tree不支持排序,没有顺序特性。