详解MySQL索引失效

本文涉及的产品
RDS MySQL Serverless 基础系列,0.5-2RCU 50GB
云数据库 RDS MySQL,集群系列 2核4GB
推荐场景:
搭建个人博客
RDS MySQL Serverless 高可用系列,价值2615元额度,1个月
简介: B+树结构索引失效的根本原因其实就是违反了B+树的结构特性,查找的时候没办法在B+树上继续走下去,所以首先我们来回顾一下B+树的数据结构。如果对B树、B+树不熟悉的可以看一下博主之前的文章,详细介绍了这两种数据结构:数据结构(8)树形结构——B树、B+树(含完整建树过程)_b+树构造过程__BugMan的博客-CSDN博客B+树是一棵N叉树,遵循每个节点遵循左<根<右,然后叶节点上是一条分支上的所有数据,且为了方便范围查询,叶子节点用指针连接。

B+树结构

索引失效的根本原因其实就是违反了B+树的结构特性,查找的时候没办法在B+树上继续走下去,所以首先我们来回顾一下B+树的数据结构。

如果对B树、B+树不熟悉的可以看一下博主之前的文章,详细介绍了这两种数据结构:数据结构(8)树形结构——B树、B+树(含完整建树过程)_b+树构造过程__BugMan的博客-CSDN博客

B+树是一棵N叉树,遵循每个节点遵循左<根<右,然后叶节点上是一条分支上的所有数据,且为了方便范围查询,叶子节点用指针连接。

37b2588a976c48ad8b10b1e254fe420f.png

测试数据

以下是本文中用到的测试表结构和数据。

表结构:

create table school_timetable
(
    id   bigint primary key,
    tid bigint,
    cid bigint
)engine = innodb
 default charset = utf8;

表数据:

insert into school_timetable value(1,1,1);
insert into school_timetable value(2,2,2);
insert into school_timetable value(3,3,3);
insert into school_timetable value(4,4,4);

索引失效的情况

索引失效的情况可以归类为以下几类:

  • 没有用到索引
  • 违反左前缀原则
  • 范围查询断索引
  • like需要分情况
  • 结果数据超过半数

没有用到索引

没有用到索引当然索引就不会生效,比如以下条件字段上没有建立任何索引,查找的时候只能老实的全表扫描,从头到尾去找匹配的数。反应在SQL的执行计划上就是type为ALL:

1dd8412cc9f0403a93d57c31b1635ad3.png

违反左前缀原则

左前缀原则,指在使用复合索引时,只有当查询条件涵盖复合索引的最左边连续一段时,索引才能被充分利用。


注意:只有在MySQL 8版本以前,违反左前缀原则才会造成索引失效,因为在MySQL 8版本以后创建复合索引的时候会在复合索引的每个字段上再单独创建一个索引,这样即使违反了左前缀原则,仍然有单字段索引能走。

左前缀原则其实从B+树的数据机构的特性能很好想明白,在复合索引的时候,索引在树上面的位置一定是按照范围索引的顺序来排序的,先按照复合索引里面的第一个字段来排序,当第一个字段相等时按照第二个字段来排序,以此类推:

4422db234c244943a315b77c201b5643.png

以上面的复合索引为例子,假设我们的查询条件是:


number=10001 and birthday = 2001-09-03


明显可以看到先通过number=10001定位后,直接用birthday的话是没办法利用到左大右小的性质继续走下去的,后续的查找只能是去扫描剩下的全部,反应在SQL执行计划里就是从断开的地方开始type跌落为range。


以下是各种违法左前缀原则的情况总结:

dd57703f4b6e42d7b5bdbe86b1c77e9f.png

范围查询断索引

范围查询断索引,意思是在查询条件中间如果出现了范围查询,从范围查询处开始,后续的索引字段会失效,反应在SQL执行计划上就是type为range,以下用我们的测试数据为例:

index(tid,cid)

6041cef8b1704d8eb7e1f2efbcff091a.png

范围查询断索引的原因结合B+树的结构特性能很容易想明白,用了范围查询后框出来的是一个范围而不是一个具体的节点,自然走到这里就走不下去了,后续的条件必须去和范围里的每个节点进行比对、匹配。

like需要分情况

在使用like的时候会不会造成索引失效,分以下两种情况:


不以%开头

以%开头

如果开头没用通配符%开头,那么就是个范围查询,SQL执行计划的type是range,如果用了通配符%开头,那么也直接会跌落到SQL的执行计划的type为ALL。这个思考一下就能想明白,用了通配符就必须去每条数据挨着比对才行,根本就走不了B+树。


如果非要使用%的话,可以使用覆盖索引,这样的话能强行将type从全表扫描拉回到index,这是唯一的优化办法,至于其中关于覆盖索引的原理,将会在后续关于SQL索引优化的相关文章中进行讨论。


结果数据超过半数

当查询的结果数量超过总数量的一半时,MySQL 通常会放弃使用索引而执行全表扫描,这是因为对于大多数查询优化器来说,全表扫描比使用索引然后回溯一半以上的数据更快。


当查询的结果数量超过总数量的一半时,这意味着通过索引进行过滤的效果相对较差。在这种情况下,如果使用索引来定位一半以上的数据,并回溯它们以匹配查询条件,可能会导致更多的磁盘 I/O 和 CPU 开销,从而降低查询性能。


因此,为了提高查询性能,MySQL 通常会选择执行全表扫描,以避免索引回溯的开销。

相关实践学习
如何快速连接云数据库RDS MySQL
本场景介绍如何通过阿里云数据管理服务DMS快速连接云数据库RDS MySQL,然后进行数据表的CRUD操作。
全面了解阿里云能为你做什么
阿里云在全球各地部署高效节能的绿色数据中心,利用清洁计算为万物互联的新世界提供源源不断的能源动力,目前开服的区域包括中国(华北、华东、华南、香港)、新加坡、美国(美东、美西)、欧洲、中东、澳大利亚、日本。目前阿里云的产品涵盖弹性计算、数据库、存储与CDN、分析与搜索、云通信、网络、管理与监控、应用服务、互联网中间件、移动服务、视频服务等。通过本课程,来了解阿里云能够为你的业务带来哪些帮助 &nbsp; &nbsp; 相关的阿里云产品:云服务器ECS 云服务器 ECS(Elastic Compute Service)是一种弹性可伸缩的计算服务,助您降低 IT 成本,提升运维效率,使您更专注于核心业务创新。产品详情: https://www.aliyun.com/product/ecs
相关文章
Mysql的索引
MYSQL索引主要有 : 单列索引 , 组合索引和空间索引 , 用的比较多的就是单列索引和组合索引 , 空间索引我这边没有用到过 单列索引 : 在MYSQL数据库表的某一列上面创建的索引叫单列索引 , 单列索引又分为 ● 普通索引:MySQL中基本索引类型,没有什么限制,允许在定义索引的列中插入重复值和空值,纯粹为了查询数据更快一点。 ● 唯一索引:索引列中的值必须是唯一的,但是允许为空值 ● 主键索引:是一种特殊的唯一索引,不允许有空值 ● 全文索引: 只有在MyISAM引擎、InnoDB(5.6以后)上才能使⽤用,而且只能在CHAR,VARCHAR,TEXT类型字段上使⽤用全⽂文索引。
MySQL索引策略与查询性能调优实战
在实际应用中,需要根据具体的业务需求和查询模式,综合运用索引策略和查询性能调优方法,不断地测试和优化,以提高MySQL数据库的查询性能。
425 66
深入解析MySQL的EXPLAIN:指标详解与索引优化
MySQL 中的 `EXPLAIN` 语句用于分析和优化 SQL 查询,帮助你了解查询优化器的执行计划。本文详细介绍了 `EXPLAIN` 输出的各项指标,如 `id`、`select_type`、`table`、`type`、`key` 等,并提供了如何利用这些指标优化索引结构和 SQL 语句的具体方法。通过实战案例,展示了如何通过创建合适索引和调整查询语句来提升查询性能。
646 9
MySQL索引学习笔记
本文深入探讨了MySQL数据库中慢查询分析的关键概念和技术手段。
323 80
MySQL底层概述—8.JOIN排序索引优化
本文主要介绍了MySQL中几种关键的优化技术和概念,包括Join算法原理、IN和EXISTS函数的使用场景、索引排序与额外排序(Using filesort)的区别及优化方法、以及单表和多表查询的索引优化策略。
115 22
MySQL底层概述—8.JOIN排序索引优化
MySQL索引有哪些类型?
● 普通索引:最基本的索引,没有任何限制。 ● 唯一索引:索引列的值必须唯一,但可以有空值。可以创建组合索引,则列值的组合必须唯一。 ● 主键索引:是特殊的唯一索引,不可以有空值,且表中只存在一个该值。 ● 组合索引:多列值组成一个索引,用于组合搜索,效率高于索引合并。 ● 全文索引:对文本的内容进行分词,进行搜索。
MySQL原理简介—9.MySQL索引原理
本文详细介绍了MySQL索引的设计与使用原则,涵盖磁盘数据页的存储结构、页分裂机制、主键索引设计及查询过程、聚簇索引和二级索引的原理、B+树索引的维护、联合索引的使用规则、SQL排序和分组时如何利用索引、回表查询对性能的影响以及索引覆盖的概念。此外还讨论了索引设计的案例,包括如何处理where筛选和order by排序之间的冲突、低基数字段的处理方式、范围查询字段的位置安排,以及通过辅助索引来优化特定查询场景。总结了设计索引的原则,如尽量包含where、order by、group by中的字段,选择离散度高的字段作为索引,限制索引数量,并针对频繁查询的低基数字段进行特殊处理等。
102 18
MySQL原理简介—9.MySQL索引原理
MySQL底层概述—6.索引原理
本文详细回顾了:索引原理、二叉查找树、平衡二叉树(AVL树)、红黑树、B-Tree、B+Tree、Hash索引、聚簇索引与非聚簇索引。
105 11
MySQL底层概述—6.索引原理
MySQL秘籍之索引与查询优化实战指南
最左前缀原则。不冗余原则。最大选择性原则。所谓前缀索引,说白了就是对文本的前几个字符建立索引(具体是几个字符在建立索引时去指定),比如以产品名称的前 10 位来建索引,这样建立起来的索引更小,查询效率更快!
142 22
 MySQL秘籍之索引与查询优化实战指南
浅入浅出——MySQL索引
本文介绍了数据库索引的概念和各种索引结构,如哈希表、B+树、InnoDB引擎的索引运作原理等。还分享了覆盖索引、联合索引、最左前缀原则等优化技巧,以及如何避免索引误用,提高数据库性能。