对线面试官 - 如何理解MySQL的索引覆盖和索引下推

本文涉及的产品
PolarClaw,2核4GB
RDS MySQL DuckDB 分析主实例,基础系列 4核8GB
RDS DuckDB + QuickBI 企业套餐,8核32GB + QuickBI 专业版
简介: 索引下推是MySQL 5.6引入的优化,允许部分WHERE条件在索引中处理,减少回表次数。例如,对于索引(zipcode, lastname, firstname),查询`WHERE zipcode='95054' AND lastname LIKE '%etrunia%'`时,索引下推先过滤zipcode,然后在索引中应用lastname条件,降低回表需求。索引下推可在EXPLAIN的`Using index condition`中看到。

面试官:了解MySQL的索引吧?

派大星:是的,有了解。

面试官:那你能简单聊聊是什么MySQL的覆盖索引吗?

派大星:可以。

覆盖索引,也就是covering index。指的是一个查询语句的执行只用从索引中就能获取到目标数据,不必从数据表中读取。因此也可称之为实现了索引覆盖

当我们执行一条查询语句符合覆盖索引时,MySQL只需要通过索引就可以返回查询所需要的数据,这样避免了查到索引后再返回查表操作,减少I/O并提高了效率。

比如:我们有一张表covering_tabel,其中有一个普通索引idx_key1_key2(key1, key2)。当我们执行SQLselect key1 from covering_table where key1 = "ketvalue"的时候,此时其实就i是通过了覆盖索引进行查询,无需回表。

但是在使用过程中要注意的是:有两种情况是不满足的:

  1. sql的where条件不符合最左前缀匹配原则
  2. SQL查询的字段不属于联合索引

比如如果sql不符合最左前缀匹配,即使是索引覆盖也是无法使用到索引的(会扫描索引树),比如这个SQLselect key1 from covering_table where key2 = "keyvalue"

要是SQL中的查询字段也没有包含在联合索引中,其实也是不会走索引覆盖的。比如:
select key2, key3 from covering_table where key1 = "keyvalue"

面试官:嗯,理解可以,那你知道什么是索引下推吗?

派大星:有了解,索引下推是MySQL在5.6中引入的一种优化技术,默认是开启状态的。当然也可以通过set optimizer_switch = index_condition_pushdown = off进行关闭。

官方文档中大致解释如下:

  • 假设有一个people表中的(zipcode、lastname、firstname)构成一个索引。
    SELECT * FROM people
    WHERE zipcode='95054'
    AND lastname LIKE '%etrunia%'
    AND address LIKE '%Main Street%';
    
    如果要是上述SQL在没有使用索引下推技术,则MySQL会通过 zipcode='95054' 从存储引擎中查询对应的数据,返回到MySQL服务端,然后MySQL服务端基于lastname LIKE '%etrunia%' 和 address LIKE '%Main Street%'; 来判断是否符合条件。

但是如果使用了索引下推技术的话,MySQL则会通过 zipcode='95054' 先返回符合条件的索引,然后根据lastname LIKE '%etrunia%' 来判断索引是否符合条件。如果符合条件,就会根据该索引来定位对应的数据,如果不符合,则直接reject掉,有了索引下推的优化,可以在like条件查询的情况下,减少回表的次数。

需要注意的是:当一条SQL使用到了索引下推时,那么explain的执行计划中的extra字段对应的内容为:Using index condition

这个具体可以参考官方文档:

https://dev.mysql.com/doc/refman/8.0/en/index-condition-pushdown-optimization.html

如图:

image.png

面试官:挺好。那你觉得索引下推只是在Like的情况下吗?官方其实是只提到了Like,这里你有什么想法吗?

派大星:其实,我个人认为在上面的例子以及官网中都是只提到了like,但其实不知有like。因为我认为索引下推其实是解决索引失效带来的效率低的问题的一种手段。

所以在联合索引中,由于某个前导列因为索引失效而要进行扫表并回表时,就可以进行索引下推优化了。

比如:有联合索引a,b。类型都是varchar,下面这个SQL也是可以用到索引下推的。

select d from t where a = "test" and b = 1;

因为上述SQL的字段类型不匹配导致索引失效,但是通过索引下推优化其实是可以减少回表的次数的。

面试官:不错那你知道什么是回表,怎么减少回表的次数吗

派大星:这个了解一些。
在 InnoDB 里,索引B+ Tree的叶子节点存储了整行数据的是主键索引,也被称之为聚簇索引。而索引B+ Tree的叶子节点存储了主键的值的是非主键索引,也被称之为非聚簇索引。

在存储的数据方面,主键(聚簇)索引的B+树的叶子节点直接就是我们要查询的整行数据了。而非主键(非聚簇)索引的叶子节点是主键的值。

那么,当我们根据非聚簇索引查询的时候,会先通过非聚簇索引查到主键的值,之后,还需要再通过主键的值再进行一次查询才能得到我们要查询的数据。而这个过程就叫做回表。

所以,在InnoDB 中,使用主键查询的时候,是效率更高的, 因为这个过程不需要回表。另外,依赖覆盖索引索引下推等技术,我们也可以通过优化索引结构以及SQL语句减少回表的次数。

面试官:嗯,理解的十分透彻。有想法。

派大星:谢谢。

相关实践学习
每个IT人都想学的“Web应用上云经典架构”实战
本实验从Web应用上云这个最基本的、最普遍的需求出发,帮助IT从业者们通过“阿里云Web应用上云解决方案”,了解一个企业级Web应用上云的常见架构,了解如何构建一个高可用、可扩展的企业级应用架构。
MySQL数据库入门学习
本课程通过最流行的开源数据库MySQL带你了解数据库的世界。   相关的阿里云产品:云数据库RDS MySQL 版 阿里云关系型数据库RDS(Relational Database Service)是一种稳定可靠、可弹性伸缩的在线数据库服务,提供容灾、备份、恢复、迁移等方面的全套解决方案,彻底解决数据库运维的烦恼。 了解产品详情: https://www.aliyun.com/product/rds/mysql 
相关文章
|
9月前
|
存储 SQL 关系型数据库
mysql底层原理:索引、慢查询、 sql优化、事务、隔离级别、MVCC、redolog、undolog(图解+秒懂+史上最全)
mysql底层原理:索引、慢查询、 sql优化、事务、隔离级别、MVCC、redolog、undolog(图解+秒懂+史上最全)
mysql底层原理:索引、慢查询、 sql优化、事务、隔离级别、MVCC、redolog、undolog(图解+秒懂+史上最全)
|
11月前
|
缓存 NoSQL 关系型数据库
美团面试:MySQL有1000w数据,redis只存20w的数据,如何做 缓存 设计?
美团面试:MySQL有1000w数据,redis只存20w的数据,如何做 缓存 设计?
美团面试:MySQL有1000w数据,redis只存20w的数据,如何做 缓存 设计?
|
9月前
|
存储 关系型数据库 MySQL
MySQL数据库索引的数据结构?
MySQL中默认使用B+tree索引,它是一种多路平衡搜索树,具有树高较低、检索速度快的特点。所有数据存储在叶子节点,非叶子节点仅作索引,且叶子节点形成双向链表,便于区间查询。
251 4
|
11月前
|
存储 关系型数据库 MySQL
阿里面试:MySQL 一个表最多 加几个索引? 6个?64个?还是多少?
阿里面试:MySQL 一个表最多 加几个索引? 6个?64个?还是多少?
阿里面试:MySQL 一个表最多 加几个索引? 6个?64个?还是多少?
|
9月前
|
关系型数据库 MySQL Java
字节面试: MySQL 百万级 导入发生的 “死锁” 难题如何解决?“2序4拆”,彻底攻克
字节面试: MySQL 百万级 导入发生的 “死锁” 难题如何解决?“2序4拆”,彻底攻克
字节面试: MySQL 百万级 导入发生的 “死锁” 难题如何解决?“2序4拆”,彻底攻克
|
9月前
|
存储 SQL 关系型数据库
MySQL 核心知识与索引优化全解析
本文系统梳理了 MySQL 的核心知识与索引优化策略。在基础概念部分,阐述了 char 与 varchar 在存储方式和性能上的差异,以及事务的 ACID 特性、并发事务问题及对应的隔离级别(MySQL 默认 REPEATABLE READ)。 索引基础部分,详解了 InnoDB 默认的 B+tree 索引结构(多路平衡树、叶子节点存数据、双向链表支持区间查询),区分了聚簇索引(数据与索引共存,唯一)和二级索引(数据与索引分离,多个),解释了回表查询的概念及优化方法,并分析了 B+tree 作为索引结构的优势(树高低、效率稳、支持区间查询)。 索引优化部分,列出了索引创建的六大原则
235 2
|
10月前
|
存储 关系型数据库 MySQL
MySQL覆盖索引解释
总之,覆盖索引就像是图书馆中那些使得搜索变得极为迅速和简单的工具,一旦正确使用,就会让你的数据库查询飞快而轻便。让数据检索就像是读者在图书目录中以最快速度找到所需信息一样简便。这样的效率和速度,让覆盖索引成为数据库优化师傅们手中的尚方宝剑,既能够提升性能,又能够保持系统的整洁高效。
319 9
|
11月前
|
机器学习/深度学习 关系型数据库 MySQL
对比MySQL全文索引与常规索引的互异性
现在,你或许明白了这两种索引的差异,但任何技术决策都不应仅仅基于理论之上。你可以创建你的数据库实验环境,尝试不同类型的索引,看看它们如何影响性能,感受它们真实的力量。只有这样,你才能熟悉它们,掌握什么时候使用全文索引,什么时候使用常规索引,以适应复杂多变的业务需求。
289 12
|
7月前
|
缓存 关系型数据库 BI
使用MYSQL Report分析数据库性能(下)
使用MYSQL Report分析数据库性能
511 158
|
7月前
|
关系型数据库 MySQL 数据库
自建数据库如何迁移至RDS MySQL实例
数据库迁移是一项复杂且耗时的工程,需考虑数据安全、完整性及业务中断影响。使用阿里云数据传输服务DTS,可快速、平滑完成迁移任务,将应用停机时间降至分钟级。您还可通过全量备份自建数据库并恢复至RDS MySQL实例,实现间接迁移上云。

相关产品

  • 云数据库 RDS MySQL 版
  • 推荐镜像

    更多