【数据库专题】如何理解数据库的索引?

简介: 【数据库专题】如何理解数据库的索引?

前言


索引是帮助数据库来高效获取数据的一种排好顺序的数据结构


正文


一、数据结构


二叉查找树


定义:根节点的值大于其左子树中任意一个节点的值,小于其右节点中任意一节点的值;

优点:查找指定数据不需要遍历全表,时间效率类似二分查找;

缺点:在特殊情况下会退化成链表结构,查找尾部数据需要遍历所有数据;


平衡二叉树


定义:一种特殊的二叉查找树,它会通过自旋操作来确保各个叶子节点之间的高度差不会超过平衡因子值;

优点:即使在特殊情况下,各个叶子节点的高度不会相差太大,查找效率都接近;

缺点:需要频繁地自旋,比较耗费时间;


红黑树


定义:是一种减弱版本的平衡二叉树,放弃了追求完全平衡,而是大致平衡。每个节点不是黑色就是红色,根节点和叶子节点为黑色, 如果一个节点是红色的,则它的子节点必须是黑色的;从任意一个节点到其子节点的所有路径都包含相同数目的黑色节点;

优点:确保没有一条路径会比其它路径长出两倍;所有数据的深度都是差不多的,和平衡二叉树相比,每次插入最多只需要三次自旋就能达到平衡,从而降低了自旋频率,维护效率更高;

缺点:在大数据量的情况下,树的高度会非常高,查找叶子节点的时间效率比较低;


B-Tree


定义:B树是一种多路搜索树,并不一定是二叉的,一个节点保存多个数据,从左到右递增,所有叶子节点都位于同一层,具有相同的高度,所有数据都不重复;

优点:和二叉树相比,单个节点存储了更多的数据,因此有更多的分叉,树的高度大大降低了,因此查找数据的效率提高了;

缺点:相较于二叉树,实现比较复杂;无法很好地应付范围查找;


B+Tree

定义:和B-Tree相比,非叶子节点不存储数据,只存储冗余索引,所有的数据和索引都挪到了叶子节点上,且叶子节点之间有双向指针连接,提高区间访问的性能;

优点:因为非叶子节点不存储数据,因此单个节点可以存储更多的索引,从而有更多的分叉,也就间接地降低了整棵树的高度;更重要的是,因为叶子节点之间有双向指针,可以很好地实现范围查找;

缺点:查找每个数据都必须从根节点到叶子节点,但是因为树的高度大大降低了,因此也可以接受;


Hash


定义:一种散列算法;

优点:等值查找效率非常高,优于B+Tree;

缺点:可能会发生散列碰撞,且不能很好地应付范围查找;而B+Tree因为有叶子节点之间的双向指针,就可以很好地支持范围查找;


二、存储引擎


存储引擎是决定如何存储数据的方式,是作用于表的,每张表的存储引擎可以不同,下面是MYSQL中两个比较常见的存储引擎。


MyISAM


索引文件(MYI)和数据文件(MYD)是分离的,一次索引查询先在MYI中找到数据的存储地址,然后在MYD中根据存储地址找到该数据。


InnoDB


索引和数据是聚集存储在ibd文件中的,不用回表读取数据,效率一般比MyISAM要高。


  • 聚集索引,叶子节点包含了完整的数据记录,决定了不用回表查询;
  • 必须要有主键,且推荐使用自增的整型,这是为了维护B+Tree的数据结构,且比较效率更快,存储空间更小。如果没有指定主键,会自己找 唯一索引列建立主键,如果没有唯一索引列,会自动建立rowid隐藏列,这一切都是为了维护B+Tree的数据结构。


三、建立索引的建议


  • 应在经常用于查询的字段上建立索引;
  • 应在经常用于连接的字段上建立索引;
  • 应在经常需要进行范围查找的字段上建立索引;
  • 应在经常需要排序的字段上建立索引;
  • 不应在查询中很少使用的字段上建立索引;
  • 不应对需要经常更新的表建立过多的索引;
  • 不应在数据量很小的表上建立索引;
  • 不应在数据取值区分度很小的字段上建立索引;


四、附录


https://www.cs.usfca.edu/~galles/visualization/Algorithms.html?url_type=39&object_type=webpage&pos=1

https://blog.csdn.net/wyqwilliam/article/details/82935922



相关文章
|
2月前
|
数据库 索引
深入探索数据库索引技术:回表与索引下推解析
【10月更文挑战第15天】在数据库查询优化的领域中,回表和索引下推是两个核心概念,它们对于提高查询性能至关重要。本文将详细解释这两个术语,并探讨它们在数据库操作中的作用和影响。
60 3
|
2月前
|
数据库 索引
深入理解数据库索引技术:回表与索引下推详解
【10月更文挑战第23天】 在数据库查询性能优化中,索引的使用是提升查询效率的关键。然而,并非所有的索引都能直接加速查询。本文将深入探讨两个重要的数据库索引技术:回表和索引下推,解释它们的概念、工作原理以及对性能的影响。
88 3
|
1月前
|
存储 缓存 数据库
数据库索引采用B+树不采用B树的原因?
B+树优化了数据存储和查询效率,数据仅存于叶子节点,便于区间查询和遍历,磁盘读写成本低,查询效率稳定,特别适合数据库索引及范围查询。
39 6
|
2月前
|
存储 缓存 数据库
数据库索引采用B+树不采用B树的原因
B+树相较于B树,在数据存储、磁盘读写、查询效率及范围查询方面更具优势。数据仅存于叶子节点,便于高效遍历和区间查询;内部节点不含数据,提高缓存命中率;查询路径固定,效率稳定;特别适合数据库索引使用。
33 1
|
2月前
|
数据库 索引
数据库索引
数据库索引 1、索引:建立在表一列或多列的辅助对象,目的是加快访问表的数据。 2、索引的优点: (1)、创建唯一性索引,可以确保数据的唯一性; (2)、大大加快数据检索速度; (3)、加速表与表之间的连接; (4)、在查询过程中,使用优化隐藏器,提高系统性能。 3、索引的缺点: (1)、创建和维护索引需要耗费时间,随数据量增加而增加; (2)、索引占用物理空间; (3)、对表的数据进行增删改时,索引需要动态维护,降低了数据的维护速度。
40 2
|
3月前
|
存储 关系型数据库 MySQL
Mysql(4)—数据库索引
数据库索引是用于提高数据检索效率的数据结构,类似于书籍中的索引。它允许用户快速找到数据,而无需扫描整个表。MySQL中的索引可以显著提升查询速度,使数据库操作更加高效。索引的发展经历了从无索引、简单索引到B-树、哈希索引、位图索引、全文索引等多个阶段。
77 3
Mysql(4)—数据库索引
|
2月前
|
监控 关系型数据库 MySQL
数据库优化:MySQL索引策略与查询性能调优实战
【10月更文挑战第27天】本文深入探讨了MySQL的索引策略和查询性能调优技巧。通过介绍B-Tree索引、哈希索引和全文索引等不同类型,以及如何创建和维护索引,结合实战案例分析查询执行计划,帮助读者掌握提升查询性能的方法。定期优化索引和调整查询语句是提高数据库性能的关键。
358 1
|
2月前
|
存储 关系型数据库 数据库
Postgres数据库BRIN索引介绍
BRIN索引是PostgreSQL提供的一种高效、轻量级的索引类型,特别适用于大规模、顺序数据的范围查询。通过存储数据块的摘要信息,BRIN索引在降低存储和维护成本的同时,提供了良好的查询性能。然而,其适用场景有限,不适合随机数据分布或频繁更新的场景。在选择索引类型时,需根据数据特性和查询需求进行权衡。希望本文对你理解和使用PostgreSQL的BRIN索引有所帮助。
60 0
|
2月前
|
监控 关系型数据库 MySQL
数据库优化:MySQL索引策略与查询性能调优实战
【10月更文挑战第26天】数据库作为现代应用系统的核心组件,其性能优化至关重要。本文主要探讨MySQL的索引策略与查询性能调优。通过合理创建索引(如B-Tree、复合索引)和优化查询语句(如使用EXPLAIN、优化分页查询),可以显著提升数据库的响应速度和稳定性。实践中还需定期审查慢查询日志,持续优化性能。
138 0
|
3月前
|
关系型数据库 MySQL 数据库
深入浅出MySQL索引优化:提升数据库性能的关键
在这个数据驱动的时代,数据库性能的优劣直接关系到应用的响应速度和用户体验。MySQL作为广泛使用的数据库之一,其索引优化是提升查询性能的关键。本文将带你一探MySQL索引的内部机制,分析索引的类型及其适用场景,并通过实际案例演示如何诊断和优化索引,以实现数据库性能的飞跃。