数据库的物理设计,数据库索引的相关笔记。
B+树索引
数据库中最普遍的使用方法。底层硬盘的存储也有使用B+树。
B+树属于多路平衡搜索树,理论复杂度和平衡二叉树相同操作都是log(n)。因为多路的特性,I/O操作上更有优势,并且也让树的深度降低。所以,设计B+树时,是尽可能让树的深度降低的。
只所以使用B+树而不是B-数,是因为B+树的关键字全在叶子节点。这样一来,硬盘一个簇可以存更多节点。可减少IO次数。
Hash索引
使用Hash算法计算出散列值,通过散列值快速定位查找的数据。
Hash索引可能是访问数据库中数据的最快方法,因为Hash算法几乎可以认为是O(1)的。
但是 Hash 索引本身由于其特殊性也带来了很多限制和弊端。
(1)Hash可能出现碰撞,通常有链表法和开放寻址法来解决。如果碰撞多了,无疑降低了Hash索引的速度。
(2)Hash计算出散列后,因为碰撞的原因,还需要进行实际数据对比。
(3)Hash算法只能定位单个,无法进行范围查询。自然,如果是组合索引,也无法用部分索引键查询。
聚簇存储
可以类比成有序数组,相关属性按序排列。
一个关系只能在一个聚簇中,其次不适用于经常更新的关系。
所以聚簇存储通常适用于:
(1)经常一起进行连接操作的关系。
(2)关系的一组属性经常出现在相等的比较条件中。
(3)关系的属性上的值重复率很高。
转载请注明:旅途@KryptosX » 数据库关系模式存取方式