【MySQL进阶-07】深入理解mysql性能优化以及解决慢查询问题

本文涉及的产品
云数据库 RDS MySQL,集群系列 2核4GB
推荐场景:
搭建个人博客
RDS MySQL Serverless 基础系列,0.5-2RCU 50GB
日志服务 SLS,月写入数据量 50GB 1个月
简介: 【MySQL进阶-07】深入理解mysql性能优化以及解决慢查询问题

一,mysql的性能优化

1,mysql调优的基本思路

mysql性能优化中,存在一个调优的金字塔,如下图所示。


主要有硬件和OS调优,MySql调优和架构调优这三种,并且越往上他的成本就越来越高,越往下他的效果就越来越好。如磁盘调优可以将机械硬盘换成SSD硬盘;架构调优可以进行分库分表,读写分离,并且可以在最初的系统设计时,可以根据业务来选择使用一些中间件,如redis,es,hbase等;MySql调优就是对一些sql语句,如添加索引,所有等进行调优。


2,慢查询优化

2.1,慢查询日志的基本使用

慢查询日志,指的就是mysql记录所有执行超过 long_query_time 参数设定的时间阈值的SQL语句的日志。默认情况下,慢查询日志是关闭的,因此如果要使用上这个慢查询日志,那么就需要开启这个慢查询日志的功能。

show VARIABLES like 'slow_query_log'; 

通过上面这条命令来查询当前mysql的慢查询日志功能是否开启,如果没有开启,那么就通过下面这条命令来开启

//开启慢查询日志功能
set GLOBAL slow_query_log = 1;

接下来可以查看这个慢查询日志的这个时间阈值,该值默认是10s,这个值也可以进行一个修改。当查询的语句的时间超过10s时,那么就会将该语句记录到日志中。

show VARIABLES like '%long_query_time%'; 

8a218c5b39f14ce8911186a912bf474c.png


对于这个慢查询产生的日志,一般是存储在这个table和file中,最好是存储在这个file文件中,因为放表的话会影响mysql的执行效率,并且这个日志文件一般是存储在这个data的目录下

show VARIABLES like 'log_output'; 

2.2,对慢查询进行优化

在开启这个慢查询日志之后,在超过这个10s的阈值时,这条sql就会添加到这个慢查询的日志里面,那么就可以通过这些日志文件查看哪些sql语句的执行效率比较低,然后再分析这些sql的效率低下的原因。在查看文件中的日志时,可以借助这个慢查询的辅助工具mysqldumpslow来对这些日志进行分析,并且可以通过这个辅助工具进行一个快速定位。

mysqldumpslow -s r -t 10 slow-mysql.log

在使用这个工具时,其伴有以下几个参数:


-s order (c,t,l,r,at,al,ar)
    c:总次数
    t:总时间
    l:锁的时间
    r:获取结果的行数
    at:平均数
    -s:排序
    -t:NUM,仅显示前n条数据
    -g:筛选数据

在分析这个慢sql时,主要通过以下的几个方法和思路来进行sql的优化:


2.2.1,在业务层中-是否请求了不需要的数据

1,是否查询了不需要的记录,如只需要获取最早创建的时间的数据,但是确实直接获取了全部数据,在内存中获取最小的时间,这样将其他查询出来的数据全部不要,这样就会让整个sql相对来说比较慢


2,总是取出全部的列,如果时只需要查询少量的字段,那么就杜绝这个select * 的使用,并且这样也可以防止覆盖索引的失效问题。但是需要在数据缓存的时候,还是需要写select * 的


3,重复查询相同的数据,如在一个for循环中,每循环一次都是使用一个sql查询,这样就可以将这个查询放在这个循环的外面。或者直接加入到缓存中,后面直接去缓存中获取数据


2.2.2,在执行层中-是否存在扫描额外的记录

1,响应时间,通过具体的响应时间来判断是否存在额外扫描,如是否出现大量数据的网络传输,加行锁的情况


2,扫描的行数和返回的行数,这个如典型的limit,会先将全部数据查出来,然后取10条,将其他的数据全部弃掉


3,扫描的行数和返回的类型,如通过这个explain来具体分析,通过这个type来确认这个索引的类型等,这个主要是通过这个索引,因为索引可以让 MySQL以最高效、扫描行数最少的方式找到需要的记录。


在SQL语句中常见的WHERE条件,一般有三种方式,其从好到坏依次如下:


1,在索引中直接使用where条件过滤掉不匹配的数据,直接在这个引擎层完成。


2,使用覆盖索引扫描返回记录,即在Extra字段出现这个Using index时,直接从索引中过滤掉不需要的记录并返回命中的结果,直接在server层将数据返回。


3,从数据表中返回数据,在Extra这个字段出现这个Using Where时,直接在mysql的server层完成,但是需要从表中将数据读取中,然后在对这些数据进行过滤。


2.3,慢查询的重构

在发现了慢查询时,那么就需要对这个慢查询进行一个重构,其重构的思路主要有如下几种


2.3.1,将一个复杂查询拆分成多个简单查询

如存在一写条件判定,如下这种,并且存在多个这种条件判断,如果全部挤在一个sql语句中,当数据量很大时,这些业务判断逻辑如果强行加在这个mysql身上,那么就会很大的程度上影响这个sql的查询效率。

if ... then ... else if ... then ... else

这样就可以去拆分这个复杂的查询,第一个if后面做一次查询,第二个做一次查询。如查询三个年龄段的用户,如果强行在一个sql中将数据全部查出来,那么效率肯定会很低,甚至可能因为范围查询出现这个联合索失效的问题,那么就可以将这个复杂的查询拆分成三个sql语句来查询了。当然这里最好时根据具体的业务需求来决定是复杂查询还是简单查询。


2.3.2,切分查询

在数据量大的情况下,如果想一次性将所有数据全部查出,然后在对查出的数据做一个修改,那么效率肯定会特别的慢,甚至可能会引发很多锁表,耗尽系统资源的问题。那么就需要利用这个切分的概念,将大数据拆分成小数据,每次查询只完成一部分数据,从而解决慢查询的问题。如开启一个定时任务,每一分钟完成1000条数据。


2.3.3,分解关联查询

在使用这个连接查询时,可以通过这个分解这个连接查询,来提高这个查询效率。如在拆分之后,可以直接走缓存来获取结果。分解之后的的代码也可以实现复用,更容易的做到高性能和高扩展。


3,通过mysql的执行流程考虑性能优化

3.1,查询速度慢的原因

其基本流程就是建立连接,语法分析器分析,优化器优化,执行器执行,最后将结果集返回给客户端。


查询需要在不同的地方花费时间,包括网络,CPU计算,生成统计信息和执行计划、锁等待(互斥等待)等操作,尤其是向底层存储引擎检索数据的调用操作,这些调用需要在内存操作,CPU操作和内存不足时导致的IO操作上消耗时间。


如在查询出10w条数据的时候,要将结果集返回给客户端,那么其网络传输就需要部分时间;在加载数据驱动时,也需要一部分时间去加载这个驱动Driver,也需要部分时间;用户认证,语义分析,索引优化等,都需要时间。


除了这些情况之外,还要判断线程的数量,如果线程数太多,导致进程的上下文切换,也会对查询速度有一定的影响。


3.2,show profile使用(了解)

在使用这个慢查询工具依旧不能分析出这个具体的结果的时候,那么就可以通过这个 show profile 来分析这个线程到底时间花在哪里。

show profiles;

然后找到具体的mysql的位置,如在1这个位置,然后直接定位到1这个位置

show profile for query 1; 或者
show profile for all query 1;

其结果如下,其具体的值也可以从mysql的官方文档中有详细的描述。


5449477cd6a44280bfc7ea1aaf05844b.png


4,mysql查询优化规则

4.1,条件简化

如存在一些 1=1时,mysql会自动将这些简化忽视;还有如一些 a = 5 and b > a这种条件,会简化成 a = 5 and b > 5等等。


4.2,外连接消除

由于内连接和外连接最大的区别就是这个sql补齐的问题,外连接会自动补null值,内连接只查出符合条件的sql。

select * from e1 inner join e2 on e1.name = e2.name
select * from e1 left  join e2 on e1.name = e2.name

在使用这个内连接的时候,mysql内部会对这几张表做一个成本计算,会去判断一下使用哪张表作为这个驱动表的这个成本低一些,然后再根据具体的成本比较再决定选择谁作为驱动表。而使用这个外连接时,mysql默认认为from后面的表就是驱动表,join后面的表就是被驱动表,其驱动表和被驱动表的位置是固定的,那么这个mysql也不会对这个外连接做一个成本计算的优化。


因此在使用这个外连接时,可以考虑增加一个where条件,过滤掉这些被驱动表数据为null的值,因此可以将上面的left join连接查询的sql语句改写成如下:

select * from e1 left  join e2 on e1.name = e2.name where e2 is not null

这样被驱动表数据为空的数据就直接被过滤掉了,mysql就会默认的将这个值优化成内连接,这样mysql就可以根据内部的成本计算,来选择哪张表作为这个驱动表,哪张表作为这个驱动表了,这样就可以实现这个外连接消除。


4.3,子查询优化

子查询的基本语法如下

select (select name from teacher limit 1);
select name,age from (select name,age + 1 from teacher) as t;
select * from student where age in (select age-20 as age from teacher where age < 50);

在优化这个子查询的过程中,需要先判断这条sql语句的外部查询和子查询的两张表是否相关

//不相关子查询
select * from student where age in (select age-20 as age from teacher);
//相关子查询
select * from student where age in (select age-20 as age from teacher where student.class_id = teacher.class_id);

不相关就是直接先查内部的子查询,后面将参数代入到整个外部查询中;相关就是先查外部的sql语句,每查出一条数据,就代入到子查询中进行匹配,看是否满足其内部的规则。


4.3.1,子查询优化规则

再来分析这个不相关的子查询,其sql如下:

select * from student where age in (select age-20 from teacher where class_id = 1);

这里需要考虑的问题就是,在这个子查询中,可能会查询出几千甚至几万条数据,这样作为参数给前面的sql语句,首先就是效率比较慢,其实很有可能会让这个服务器内存放不下;并且在使用这个in时,mysql很有可能无法使用到索引,从而走全表扫描。


因此mysql主要的内部的优化方式就是将这个子查询作为一个临时表,然后进行一个联表查询来获取数据。并且可以给这个临时表建索引,去重等操作,或者将这些数据加入到memory的内存中,从而提高查询效率。这种表被称为物化表


而在这个物化表的基础之上,就是在建立临时表的基础上,将这个子查询再优化成这个连接查询,并且优化成内连接的连接查询,这样就在之前的物化表的基础之上提升了效率,这种优化方式被称为半连接,即semi-join


再分析一个表相关的子查询,其sql如下:

select * from student where age in (select age-20 as age from teacher where student.class_id = teacher.class_id);

这张表上是有索引的,但是不一定会使用到索引,mysql内部就会通过改变这个in关键字,将这个in改写成exists这个关键字,从而让这个字段走索引。不管子查询是相关的还是不相关的,都尝试可以使用这个exists替换in,从而解决这个in索引失效的问题。当然直接在外部直接使用这个exists关键字,这样就可以省去mysql内部转换的时间,从而增加查询效率。


相关实践学习
如何在云端创建MySQL数据库
开始实验后,系统会自动创建一台自建MySQL的 源数据库 ECS 实例和一台 目标数据库 RDS。
全面了解阿里云能为你做什么
阿里云在全球各地部署高效节能的绿色数据中心,利用清洁计算为万物互联的新世界提供源源不断的能源动力,目前开服的区域包括中国(华北、华东、华南、香港)、新加坡、美国(美东、美西)、欧洲、中东、澳大利亚、日本。目前阿里云的产品涵盖弹性计算、数据库、存储与CDN、分析与搜索、云通信、网络、管理与监控、应用服务、互联网中间件、移动服务、视频服务等。通过本课程,来了解阿里云能够为你的业务带来哪些帮助 &nbsp; &nbsp; 相关的阿里云产品:云服务器ECS 云服务器 ECS(Elastic Compute Service)是一种弹性可伸缩的计算服务,助您降低 IT 成本,提升运维效率,使您更专注于核心业务创新。产品详情: https://www.aliyun.com/product/ecs
相关文章
|
9天前
|
SQL 关系型数据库 MySQL
【赵渝强老师】MySQL的慢查询日志
MySQL的慢查询日志用于记录执行时间超过设定阈值的SQL语句,帮助数据库管理员识别并优化性能问题。通过`mysqldumpslow`工具可查看日志。本文介绍了如何检查、启用及配置慢查询日志,并通过实例演示了慢查询的记录与分析过程。
|
14天前
|
存储 缓存 负载均衡
mysql的性能优化
在数据库设计中,应选择合适的存储引擎(如MyISAM或InnoDB)、字段类型(如char、varchar、tinyint),并遵循范式(1NF、2NF、3NF)。功能上,可以通过索引优化、缓存和分库分表来提升性能。架构上,采用主从复制、读写分离和负载均衡可进一步提高系统稳定性和扩展性。
34 9
|
2月前
|
存储 SQL 关系型数据库
【MySQL调优】如何进行MySQL调优?从参数、数据建模、索引、SQL语句等方向,三万字详细解读MySQL的性能优化方案(2024版)
MySQL调优主要分为三个步骤:监控报警、排查慢SQL、MySQL调优。 排查慢SQL:开启慢查询日志 、找出最慢的几条SQL、分析查询计划 。 MySQL调优: 基础优化:缓存优化、硬件优化、参数优化、定期清理垃圾、使用合适的存储引擎、读写分离、分库分表; 表设计优化:数据类型优化、冷热数据分表等。 索引优化:考虑索引失效的11个场景、遵循索引设计原则、连接查询优化、排序优化、深分页查询优化、覆盖索引、索引下推、用普通索引等。 SQL优化。
558 15
【MySQL调优】如何进行MySQL调优?从参数、数据建模、索引、SQL语句等方向,三万字详细解读MySQL的性能优化方案(2024版)
|
1月前
|
存储 关系型数据库 MySQL
MySQL性能优化实践指南
【10月更文挑战第16天】MySQL性能优化实践指南
53 0
|
1月前
|
存储 关系型数据库 MySQL
MySQL性能优化指南
【10月更文挑战第16天】MySQL性能优化指南
43 0
|
2月前
|
存储 关系型数据库 MySQL
mysql-性能优化(一)
mysql-性能优化(一)
|
2月前
|
关系型数据库 MySQL 数据处理
针对MySQL亿级数据的高效插入策略与性能优化技巧
在处理MySQL亿级数据的高效插入和性能优化时,以上提到的策略和技巧可以显著提升数据处理速度,减少系统负担,并保持数据的稳定性和一致性。正确实施这些策略需要深入理解MySQL的工作原理和业务需求,以便做出最适合的配置调整。
364 6
|
2月前
|
SQL 存储 关系型数据库
深入 MySQL 的执行计划与性能优化
深入 MySQL 的执行计划与性能优化
40 0
|
3月前
|
SQL 关系型数据库 MySQL
【MySQL 慢查询秘籍】慢SQL无处遁形!实战指南:一步步教你揪出数据库性能杀手!
【8月更文挑战第24天】本文以教程形式深入探讨了MySQL慢SQL查询的分析与优化方法。首先介绍了如何配置MySQL以记录执行时间过长的SQL语句。接着,利用内置工具`mysqlslowlog`及第三方工具`pt-query-digest`对慢查询日志进行了详细分析。通过一个具体示例展示了可能导致性能瓶颈的查询,并提出了相应的优化策略,包括添加索引、缩小查询范围、使用`EXPLAIN`分析执行计划等。掌握这些技巧对于提升MySQL数据库性能具有重要意义。
294 1
|
3月前
|
存储 关系型数据库 MySQL
"深入探索MySQL临时表:性能优化利器,数据处理的灵活之选"
【8月更文挑战第9天】MySQL临时表专为存储临时数据设计,自动创建与删除,仅在当前会话中存在,有助于性能优化。它分为本地临时表和全局临时表(通过特定逻辑模拟)。创建语法类似于普通表,但加TEMPORARY或TEMP关键字。适用于性能优化、数据预处理和复杂查询,需注意内存占用和事务支持问题。合理使用可大幅提升查询效率。
227 2
下一篇
无影云桌面