你不得不知的MYSQL优化——索引下推-阿里云开发者社区

你不得不知的MYSQL优化——索引下推

2022-12-16 1040

版权

本文内容由阿里云实名注册用户自发贡献，版权归原作者所有，阿里云开发者社区不拥有其著作权，亦不承担相应法律责任。具体规则请查看《阿里云开发者社区用户服务协议》和《阿里云开发者社区知识产权保护指引》。如果您发现本社区中有涉嫌抄袭的内容，填写侵权投诉表单进行举报，一经查实，本社区将立刻删除涉嫌侵权内容。

本文涉及的产品

RDS MySQL DuckDB 分析主实例，基础系列 4核8GB

RDS AI 助手，专业版

RDS MySQL DuckDB 分析主实例，集群系列 4核8GB

简介： 你不得不知的MYSQL优化——索引下推

前言

说到MySQL的优化手段，不得不提的是MYSQL5.6中引入的一种新特性，索引下推，英文是 index condition pushdown，一般简称为 ICP。这也是MySQL面试中经常被问到的一个考点，本文就此分享下索引下推是怎么一回事，它是如何对提高查询效率起到帮助的。

理解索引下推

索引下推就是指在索引遍历过程中，对索引中包含的字段先做判断，直接过滤掉不满足条件的记录，减少回表次数来提高查询效率。

如何理解呢？我们直接上栗子来解释：

新建用户表

CREATE TABLE user(
     `id` int NOT NULL AUTO_INCREMENT,
     `zipcode` varchar(20) DEFAULT NULL,
     `name` varchar(20) DEFAULT NULL,
     `address` varchar(50) DEFAULT NULL,
     PRIMARY KEY (`id`),
     index idx_zip_name(`zipcode`, `name`)
) ENGINE=INNODB;
insert into user(zipcode, name, address)
values ('100001', '陈旭阳', '杭州'),
       ('100001', '胡歌', '上海'),
       ('200002', '杨幂', '北京'),
       ('300002', '刘诗诗', '南京');

创建了基于邮编zipcode和名称name的联合索引idx_zip_name，用于查找某个邮编下，名字包含陈的人。

查询语句

select * from user where zipcode = '100001' and name like '%陈%' and address like '%余杭%';

查询条件根据zipcode精确查找，name和address全模糊匹配。

如果MySQL5.6以前, 没有索引下推特性，整个流程如下图：

联合索引中知道100001的数据项，因为name是全模糊，无法走索引，address压根没有索引，他们无法在联合索引中过滤，怎么办？只能回到数据最全的聚簇索引上进行name like '%陈%' and address like '%余杭%'这个逻辑的过滤。
按照上面的方式，每次回到聚簇索引这个一个称做 “回表” 的过程，势必增加磁盘IO，从而影响查询性能。

那么有什么办法可以优化呢？

优化的目标就是尽量减少回表这一过程，我们发现联合索引上竟然有了name字段的信息，为什么我们不能充分利用呢？ name like '%陈%'我们可以直接在索引树上进行判断name是不是包含陈，从而减少回表次数。这也正是MySQL5.6中优化的特性，如下图所示：

根据查询条件name like '%陈%'，陈旭阳包含了陈，那么它去回表过滤address内容。
而其他记录比如胡歌等不包含陈，那么其他记录就无需回表，再次去匹配address地址是否符合了，相当于减少了回表。

上面图中的索引都用表格表示，只是为了方便，实际上索引底层数据结构是B+数据，如果不了解的，可以阅读文章：一步步带你设计MySQL索引数据结构

一句话总结：索引下推（index condition pushdown，ICP），有效的减少了回表次数，提高了查询效率。

索引下推性能比较

竟然索引下推可以提高效率，那我们验证下。

沿用上面的user表
创建存储过程，添加数据

DELIMITER //
CREATE PROCEDURE insert_user(max_num INT)
BEGIN
DECLARE i INT DEFAULT 0;
    SET autocommit = 0;
    REPEAT
    SET i = i + 1;
    INSERT INTO user(zipcode,name,address) VALUES ('10018', '陈旭阳', '杭州');
    UNTIL i =max_num
END REPEAT;
COMMIT;
END //
DELIMITER ;

调用存储过程

call insert_user(1000000);

打开性能检查工具profiling

set profiling = 1;

启用索引下推方式查询

select * from user where zipcode = '10018' and name like '%李%';

禁用索引下推方式查询

select /*+ no_icp(user) */ * from user where zipcode = '10018' and name like '%李%';

查看当前会话下的profiles

show profiles;

结果如下：

有索引下推0.21s

没有索引下推花了2.6s

使用ICP性能提高还是比较明显的，特别是数据量大的情况下。

执行计划中的索引下推

如何判断你的SQL中是否使用了到索引下推的特性呢？

我们利用explain查看SQL的执行计划时，如果发现Extra字段中有Using index condition，即表示使用到了索引下推。

注意如果发现一直没有用上索引下推，需要检查下功能是否被禁用，默认是打开的。

可以通过设置系统变量optimizer_switch控制：index_condition_pushdown

# 打开索引下推
SET optimizer_switch = 'index_condition_pushdown=on';
# 关闭索引下推
SET optimizer_switch = 'index_condition_pushdown=off';

总结

本文介绍了索引下推特性，并简要分析了它的实现原理。虽然说，这个特性MySQL支持了，但是为什么我们还要学习理解它呢，因为它对于我们如何写SQL、如何创建索引还是起着指导作用的。如果本文对你有帮助的话，请留下一个赞吧。

你不得不知的MYSQL优化——索引下推

前言

理解索引下推

索引下推性能比较

执行计划中的索引下推

总结

热门文章

最新文章

相关课程

相关电子书

推荐镜像

探索云世界

热门

云计算

大数据

云原生

人工智能

数据库

开发与运维

活动广场

任务中心

训练营

直播

乘风者计划

下载

镜像站

技术资料

你不得不知的MYSQL优化——索引下推

前言

理解索引下推

索引下推性能比较

执行计划中的索引下推

总结

热门文章

最新文章

相关课程

相关电子书

推荐镜像