MySQL查询优化必备

本文涉及的产品
RDS MySQL Serverless 基础系列,0.5-2RCU 50GB
RDS MySQL Serverless 高可用系列,价值2615元额度,1个月
简介: 查询优化本就不是一蹴而就的,需要学会使用对应的工具、借鉴别人的经验来对SQL进行优化,并且提升自己。

前言

先来巩固一下索引的优点,检索数据快、查询稳定、存储具有顺序性避免服务器建立临时表、将随机的I/O变为有序的I/O。


但索引一旦创建的不规范就会造成以下问题,占用额外空间,浪费内存,降低数据的增、删、改性能。


所以只有在理解索引数据结构的基础上才能创建出高效的索引。


**本文所有操作均在MySQL8.0.12**


一、创建索引规范

在学习索引优化之前,需要对创建索引的规范有一定的了解,此规范来自于阿里巴巴开发手册。


主键索引:pk_column_column


唯一索引:uk_column_column


普通索引:idx_column_column


二、索引失效原因

创建索引需知道在什么情况下索引会失效,只有了解索引失效的原因,在创建索引时才不会出现一些已知错误。


1.带头大哥不能死


这局经典的语句就是涵盖创建索引时一定要符合最左侧原则。


例如表结构为u_id,u_name,u_age,u_sex,u_phone,u_time


创建索引为idx_user_name_age_sex。


查询条件必须带上u_name这一列。


2.不在索引列上做任何操作


不在索引列上做任何计算、函数、自动或者手动的类型转换,否则会进行全表扫描。简而言之不要在索引列上做任何操作。


3.俩边类型不等


例如建立了索引idx_user_name,name字段类型为varchar


在查询时使用where name = kaka,这样的查询方式会直接造成索引失效。


正确的用法为where name = “kaka”。


4.不适当的like查询会导致索引失效


创建索引为idx_user_name


执行语句为select * from user where name like “kaka%”;可以命中索引。


执行语句为select name from user where name like “%kaka”;可以使用到索引(仅在8.0以上版本)。


执行语句为select * from user where name like ‘’%kaka";会直接导致索引失效


5.范围条件之后的索引会失效


创建索引为idx_user_name_age_sex


执行语句select * from user where name = ‘kaka’ and age > 11 and sex = 1;


上面这条sql语句只会命中name和age索引,sex索引会失效。


复合索引失效需要查看key_len的长度即可。


总结:%在后边会命令索引,当使用了覆盖索引时任何查询方式都可命中索引。


以上就是咔咔关于索引失效会出现的原因总结,在很多文章中没有标注MySQL版本,所以你有可能会看到is null 、or索引会失效的结论。


三、SQL优化杀手锏之Explain

在写完SQL语句之后必须要做的一件事情就是使用Explain进行SQL语句检测,看是否命中索引。


下图就是使用explain输出格式,接下来将会对输出格式进行简单的解释。


image.png


1.id

这列就是查询的编号,如果查询语句中没有子查询或者联合查询这个标识就一直是1。


如存在子查询或者联合查询这个编号会自增。


2.select_type


最常见的类型就是SIMPLE和PRIMARY,此列知道就行了。


3.table


理解为表名即可


4.**type


此列是在优化SQL语句时最需要关注的列之一,此列显示了查询使用了何种类型。


以下排序从最优到最差。


  • system:表内只有一行数据
  • const:最多只会有一条记录匹配,常用于主键或者唯一索引为条件查询
  • eq_ref:当连接使用的索引为主键和唯一时会出现
  • ref:使用普通索引=或<=> 运算符进行比较将会出现
  • fulltext:使用全文索引
  • ref_or_null:跟ref类型类似,只是增加了null值的判断,实际用的不多。语句为where name = ‘kaka’ and name is null,name为普通索引。
  • index_merge:查询语句使用了俩个以上的索引,常见在使用and、or会出现,官方文档将此类型放在ref_or_null之后,但是在很多的情况下由于读取索引过多性能有可能还不如range
  • unique_subquery:用于where中的in查询,完全替换子查询,效率更高。语句为value IN (SELECT primary_key FROM single_table WHERE some_expr)
  • index_subquery:子查询中的返回结果字段组合是一个索引(或索引组合),但不是一个主键或唯一索引
  • range:索引范围查询,常见于使用 =, <>, >, >=, <, <=, IS NULL, <=>, BETWEEN, IN()或者like等运算符的查询中。
  • index:索引全表扫描,把索引从头到尾扫一遍
  • all:全表扫描,性能最差。

5.possible_keys


此列显示的可能会使用到的索引


6.**key


优化器从possible_keys中命中的索引


7.key_len


查询用到的索引长度(字节数),key_len只计算where条件用到的索引长度,而排序和分组就算用到了索引,也不会计算到key_len中。


8.ref


如果是使用的常数等值查询,这里会显示const。


如果是连接查询,被驱动表的执行计划这里会显示驱动表的关联字段。


如果是条件使用了表达式或者函数,或者条件列发生了内部隐式转换,这里可能显示为func。


9.**rows


这是mysql估算的需要扫描的行数(不是精确值)。


这个值非常直观显示 SQL 的效率好坏, 原则上 rows 越少越好。


10.filtered


此列表示存储引擎返回的数据在server层过滤后,剩下多少满足查询的记录数量的比例,注意是百分比,不是具体记录数


11.**extra


在大多数情况下会出现以下几种情况。


  • Using index:使用了覆盖索引,查询列都为索引字段
  • Using where:使用了where语句
  • Using temporary :查询结果进行排序的时候使用了一张临时表
  • Using filesort :对数据使用一个外部的索引排序
  • Using index condition:使用了索引下推,关于索引下推可以查看咔咔之前文章MySQL索引一文

12.总结


以上就是关于Explain所有列的说明,在平时开发的过程中,一般只会关注type、key、rows、extra这四列。


  • type优化目标至少达到range级别,要求是ref级别,如果可以consts最好。

  • key是查询使用到的索引,如果此列为空,要么未建立索引,要么索引失效。

  • rows是这条SQL语句扫描的行数,越少越好。

  • extra:此列为扩展列,如果出现临时表、文件排序则需要优化。


四、SQL优化杀手锏之慢查询

上文说到了可以直接使用explain来分析自己的SQL语句是否合理,接下来再聊一个点那就是慢查询。


查看慢查询是否打开


image.png


查看是否记录没有使用索引的SQL语句


image.png


开启慢查询、开启记录没有使用到索引的SQL语句


set global log_queries_not_using_idnexes=‘on’;


set global log_queries_not_using_indexes=‘on’;


image.png


查询以上俩个配置是否打开


image.png


设置慢查询时间,这个时间由自己把控,一般1s即可set globle long_query_time=1;


如果查看这个时间没有变,则关于客户端在重新连接一次即可。


image.png


查看慢查询存储位置


image.png


然后随便执行一条不执行索引的语句即可在这个日志中查看到此语句


image.png


上图中一般需要主要观察的是Query_time、SQL语句内容。


以上就是关于如何使用慢查询来查看项目中出现问题的SQL语句。


五、优化大法

此处跟大家聊一些常用的SQL语句优化方案,以上的俩个工具要好好的利用,辅助我们进行打怪。


  • 禁止使用select *,需要什么字段查询什么字段
  • where字段设置索引
  • group by、order by字段设置索引
  • 舍弃offset,limit分页,使用延迟关联来实现分页(数据量不大时可不用)
  • 写分页时当count为0时,直接返回避免执行分页语句
  • 利用覆盖索引进行查询避免回表
  • 建立复合索引时区分度最高的放在最左侧
  • 统计数据行数只用count(*),别整的花里胡哨的
  • 关于in和exist,如果查询的俩个表大小一致则性能差别可忽略,如果子查询表大用exist,否则使用in
  • 查询一行数据时加上limit 1
  • 选择合理的数据类型,在满足条件下数据类型越小越好
  • 联合查询join最多三个表,并且需要join的字段数据类型保持一致
  • in操作能避免尽量避免,无法避免的情况下in元素控制在1000以内
  • 数据更新频繁,区分度不高的列不适合建立索引
  • explain中的type至少要达到range,要求为ref

联合索引满足最左侧原则


相关实践学习
基于CentOS快速搭建LAMP环境
本教程介绍如何搭建LAMP环境,其中LAMP分别代表Linux、Apache、MySQL和PHP。
全面了解阿里云能为你做什么
阿里云在全球各地部署高效节能的绿色数据中心,利用清洁计算为万物互联的新世界提供源源不断的能源动力,目前开服的区域包括中国(华北、华东、华南、香港)、新加坡、美国(美东、美西)、欧洲、中东、澳大利亚、日本。目前阿里云的产品涵盖弹性计算、数据库、存储与CDN、分析与搜索、云通信、网络、管理与监控、应用服务、互联网中间件、移动服务、视频服务等。通过本课程,来了解阿里云能够为你的业务带来哪些帮助 &nbsp; &nbsp; 相关的阿里云产品:云服务器ECS 云服务器 ECS(Elastic Compute Service)是一种弹性可伸缩的计算服务,助您降低 IT 成本,提升运维效率,使您更专注于核心业务创新。产品详情: https://www.aliyun.com/product/ecs
相关文章
|
1月前
|
关系型数据库 MySQL 数据库
MySQL索引和查询优化
MySQL索引和查询优化
46 1
|
1月前
|
SQL 缓存 关系型数据库
MySQL技能完整学习列表6、查询优化——3、查询缓存——4、SQL优化技巧
MySQL技能完整学习列表6、查询优化——3、查询缓存——4、SQL优化技巧
77 0
|
1月前
|
存储 SQL 关系型数据库
三高Mysql - Mysql索引和查询优化讲解(偏理论部分)
三高Mysql - Mysql索引和查询优化讲解(偏理论部分)
61 0
|
10月前
|
存储 算法 关系型数据库
第10章 索引优化与查询优化【2.索引及调优篇】【MySQL高级】3
第10章 索引优化与查询优化【2.索引及调优篇】【MySQL高级】3
140 0
|
1月前
|
SQL 缓存 关系型数据库
MySQL调优之关联查询、子查询优化
MySQL调优之关联查询、子查询优化
510 0
|
13天前
|
SQL 关系型数据库 MySQL
从理论到实践,Mysql查询优化剖析(联表查询)
从理论到实践,Mysql查询优化剖析(联表查询)
24 0
|
1月前
|
缓存 关系型数据库 MySQL
MySQL查询优化:提速查询效率的13大秘籍(合理使用索引合并、优化配置参数、使用分区优化性能、避免不必要的排序和group by操作)(下)
MySQL查询优化:提速查询效率的13大秘籍(合理使用索引合并、优化配置参数、使用分区优化性能、避免不必要的排序和group by操作)(下)
|
1月前
|
缓存 关系型数据库 MySQL
MySQL 查询优化:提速查询效率的13大秘籍(索引设计、查询优化、缓存策略、子查询优化以及定期表分析和优化)(中)
MySQL 查询优化:提速查询效率的13大秘籍(索引设计、查询优化、缓存策略、子查询优化以及定期表分析和优化)(中)
111 0
|
2天前
|
SQL 关系型数据库 MySQL
MySQL性能优化实战:从索引策略到查询优化
MySQL性能优化聚焦索引策略和查询优化。创建索引如`CREATE INDEX idx_user_id ON users(user_id)`可加速检索;复合索引考虑字段顺序,如`idx_name ON users(last_name, first_name)`。使用`EXPLAIN`分析查询效率,避免全表扫描和大量`OFFSET`。通过子查询优化分页,如LIMIT配合内部排序。定期审查和调整策略以提升响应速度和降低资源消耗。【6月更文挑战第22天】
88 2
|
21天前
|
存储 关系型数据库 MySQL
Mysql查询优化
Mysql查询优化
19 1