小索引大力量,记一次explain的性能优化经历

简介: 本文介绍了在MySQL生产环境中使用EXPLAIN工具进行性能优化的过程。通过分析慢查询日志,识别出性能瓶颈,并利用EXPLAIN命令解析SQL执行计划,找出全表扫描、未使用索引等问题。文章还详细描述了如何配置慢查询日志、解读EXPLAIN输出的关键字段(如type、key、rows等),并提供了优化建议,如避免左右模糊查询、减少多表联查等。最终验证优化效果,确保系统性能提升。此外,强调了项目初期建立索引的重要性,以应对未来数据量增长带来的挑战。

添加图片注释,不超过 140 字(可选)


在 MySQL 的生产环境中,性能问题是一个常见的挑战。当数据库查询响应时间变慢,或者系统资源消耗异常时,我们需要快速定位问题并进行优化。MySQL 提供了一个强大的工具——EXPLAIN,它可以帮助我们分析查询语句的执行计划,从而找到性能瓶颈。

本文模拟之前生产环境mysql性能问题的优化过程,对生产环境的复盘。系统上线后正常使用,大概1年后就出现业务慢,运维反馈某些业务操作会让服务器cpu飙升到100%以上。


添加图片注释,不超过 140 字(可选)


准备

理解 EXPLAIN 输出

EXPLAIN 命令可以附加在任何 SQL 查询语句之前,用于显示 MySQL 如何执行该查询。输出结果包含多个字段,每个字段都提供了关于查询执行的重要信息。

以下是 EXPLAIN 输出中的一些关键字段:

  • id:查询标识符,表示查询中操作的顺序。
  • select_type:查询的类型,如 SIMPLE、SUBQUERY、DERIVED 等。
  • table:查询涉及的表。
  • type:访问类型,如 ALL、index、range、ref 等,反映了 MySQL 查找行的方式。
  • possible_keys:可能用到的索引。
  • key:实际使用的索引。
  • key_len:使用的索引长度。
  • ref:显示索引的哪一列被使用了。
  • rows:MySQL 认为必须检查的用来返回请求数据的行数。
  • Extra:包含不适合在其他列中显示但十分重要的额外信息。
  • filtered:表示通过查询条件过滤后,返回的行数与rows列估计的行数的比例。这个值越高,表示查询的过滤效果越好。

MySQL开启慢查询

在使用EXPLAIN之前,确实需要确保MySQL的慢查询日志功能已经开启,因为慢查询日志记录了执行时间超过阈值的SQL语句,这些语句往往是性能调优的重点。

以下是配置MySQL慢查询日志的步骤:

1. 配置慢查询日志参数

在配置文件中my.cnf或my.ini,找到或添加以下参数来配置慢查询日志:

vim /etc/mysql/my.cnf

[mysqld] slow_query_log = 1 slow_query_log_file = /var/log/mysql/mysql-slow.log long_query_time = 2 log_queries_not_using_indexes = 1

  • slow_query_log = 1:启用慢查询日志。
  • slow_query_log_file = /var/log/mysql/mysql-slow.log:指定慢查询日志文件的路径。请确保MySQL服务有权限写入这个文件。
  • long_query_time = 2:设置慢查询的阈值,单位是秒。这里设置为2秒,执行时间超过2秒的查询会被记录到慢查询日志中。
  • log_queries_not_using_indexes = 1:如果设置为1,MySQL会记录那些没有使用索引的查询,即使它们的执行时间没有超过long_query_time的阈值。

2. 重启MySQL服务

保存配置文件后,你需要重启MySQL服务以使更改生效。在Linux系统中,可以使用以下命令重启MySQL服务:

service mysql restart

3. 验证慢查询日志配置

重启服务后,你可以通过以下SQL语句来验证慢查询日志是否已经正确配置:

mysql -uroot -p SHOW VARIABLES LIKE 'slow_query_log%';


添加图片注释,不超过 140 字(可选)


确保slow_query_log的值为ONslow_query_log_file指向正确的日志文件路径。

DBA不让开慢查询

如果说公司DBA不让开启慢查询。

理由是:

慢查询日志会记录执行时间超过指定阈值的SQL语句,这会导致日志文件的增长。

每次记录慢查询日志时,都会涉及到磁盘I/O操作,这可能会对数据库的写入性能产生影响。尤其是在高负载环境下,频繁的磁盘写入可能会略微降低数据库的整体性能。

记录慢查询的过程可能会增加查询执行的额外开销。这种开销通常很小,但在极端情况下,对于那些非常接近慢查询阈值的查询,可能会因为记录日志而导致它们被错误地标记为慢查询。

这时可以通过重现业务操作,触发慢查询,然后执行

select * from information_schema.`PROCESSLIST` where info is not null;

查询当前有哪些脚本正在执行及占用时间


添加图片注释,不超过 140 字(可选)


准备阶段最核心的作用就是找出性能比较差的脚本是哪些。找到了就可以进行下一步的explain。

性能调优

使用 EXPLAIN 的步骤

步骤 1:识别慢查询

首先,我们需要识别出哪些查询是慢查询。可以通过 MySQL 的慢查询日志或者监控工具来获取这些信息。

调取慢查询日志文件

tail -f /var/log/mysql/mysql-slow.log


添加图片注释,不超过 140 字(可选)


步骤 2:使用 EXPLAIN 分析查询

把慢查询SQL脚本,使用 EXPLAIN 来分析这些查询

添加图片注释,不超过 140 字(可选)

步骤 3:解读 EXPLAIN 输出

调整前:


添加图片注释,不超过 140 字(可选)

explain结果


添加图片注释,不超过 140 字(可选)


分析 EXPLAIN 的输出,特别关注以下几个方面:

  • type:如果 typeALL,表示进行了全表扫描,这通常是性能问题的标志。如果 typeALL,考虑创建索引。


添加图片注释,不超过 140 字(可选)


  • ALL:全表扫描(Full Table Scan)。
  • index:索引扫描(Index Scan)。与全表扫描类似,但数据库扫描的是整个索引,而不是表。
  • range:范围扫描(Range Scan)。数据库使用索引来检索特定范围内的行。
  • ref:索引查找(Index Lookup)。数据库使用非唯一索引来查找与单个列上的等值条件匹配的行。
  • eq_ref:唯一索引查找(Unique Index Lookup)。
  • NULL:表示查询不需要访问表或索引,数据库可以直接从索引中获取结果,而不需要访问表。
  • key:实际使用的索引名称,如果 keyNULL,表示没有使用索引,需要创建或优化索引。
  • rows:如果 rows 的值很大,表示 MySQL 需要检查很多行,这可能是性能瓶颈。尝试优化查询条件,减少需要检查的行数。
  • Extra:如果出现了 Using filesortUsing temporary,这些都是性能问题的信号。

步骤 4:验证优化效果

在实施优化措施后,重新使用 EXPLAIN 分析查询,并监控查询的实际执行时间,以验证优化效果。


添加图片注释,不超过 140 字(可选)


此次生产上的问题主要是没有增加索引,这里还没对SQL本身进行大量优化。比如

  • like使用左右%时,索引会失效
  • 尽量不要使用三表或三表以上的联合查询
  • 尽量减少In的使用
  • .....


添加图片注释,不超过 140 字(可选)


此次复盘的主要目的是了解explain的基本概念及使用步骤。

另外还有非常重要的一点就是项目成员重视索引的重要性,建表时索引就一条语句而已。项目初期数据量小或许体现不出来,但当数据量大了的情况下索引的能力就尤为突出。


目录
相关文章
|
2天前
|
调度 云计算 芯片
云超算技术跃进,阿里云牵头制定我国首个云超算国家标准
近日,由阿里云联合中国电子技术标准化研究院主导制定的首个云超算国家标准已完成报批,不久后将正式批准发布。标准规定了云超算服务涉及的云计算基础资源、资源管理、运行和调度等方面的技术要求,为云超算服务产品的设计、实现、应用和选型提供指导,为云超算在HPC应用和用户的大范围采用奠定了基础。
|
9天前
|
存储 运维 安全
云上金融量化策略回测方案与最佳实践
2024年11月29日,阿里云在上海举办金融量化策略回测Workshop,汇聚多位行业专家,围绕量化投资的最佳实践、数据隐私安全、量化策略回测方案等议题进行深入探讨。活动特别设计了动手实践环节,帮助参会者亲身体验阿里云产品功能,涵盖EHPC量化回测和Argo Workflows量化回测两大主题,旨在提升量化投研效率与安全性。
云上金融量化策略回测方案与最佳实践
|
11天前
|
人工智能 自然语言处理 前端开发
从0开始打造一款APP:前端+搭建本机服务,定制暖冬卫衣先到先得
通义灵码携手科技博主@玺哥超carry 打造全网第一个完整的、面向普通人的自然语言编程教程。完全使用 AI,再配合简单易懂的方法,只要你会打字,就能真正做出一个完整的应用。
8877 20
|
15天前
|
Cloud Native Apache 流计算
资料合集|Flink Forward Asia 2024 上海站
Apache Flink 年度技术盛会聚焦“回顾过去,展望未来”,涵盖流式湖仓、流批一体、Data+AI 等八大核心议题,近百家厂商参与,深入探讨前沿技术发展。小松鼠为大家整理了 FFA 2024 演讲 PPT ,可在线阅读和下载。
4769 12
资料合集|Flink Forward Asia 2024 上海站
|
15天前
|
自然语言处理 数据可视化 API
Qwen系列模型+GraphRAG/LightRAG/Kotaemon从0开始构建中医方剂大模型知识图谱问答
本文详细记录了作者在短时间内尝试构建中医药知识图谱的过程,涵盖了GraphRAG、LightRAG和Kotaemon三种图RAG架构的对比与应用。通过实际操作,作者不仅展示了如何利用这些工具构建知识图谱,还指出了每种工具的优势和局限性。尽管初步构建的知识图谱在数据处理、实体识别和关系抽取等方面存在不足,但为后续的优化和改进提供了宝贵的经验和方向。此外,文章强调了知识图谱构建不仅仅是技术问题,还需要深入整合领域知识和满足用户需求,体现了跨学科合作的重要性。
|
23天前
|
人工智能 自动驾驶 大数据
预告 | 阿里云邀您参加2024中国生成式AI大会上海站,马上报名
大会以“智能跃进 创造无限”为主题,设置主会场峰会、分会场研讨会及展览区,聚焦大模型、AI Infra等热点议题。阿里云智算集群产品解决方案负责人丛培岩将出席并发表《高性能智算集群设计思考与实践》主题演讲。观众报名现已开放。
|
11天前
|
人工智能 容器
三句话开发一个刮刮乐小游戏!暖ta一整个冬天!
本文介绍了如何利用千问开发一款情侣刮刮乐小游戏,通过三步简单指令实现从单个功能到整体框架,再到多端优化的过程,旨在为生活增添乐趣,促进情感交流。在线体验地址已提供,鼓励读者动手尝试,探索编程与AI结合的无限可能。
三句话开发一个刮刮乐小游戏!暖ta一整个冬天!
|
10天前
|
消息中间件 人工智能 运维
12月更文特别场——寻找用云高手,分享云&AI实践
我们寻找你,用云高手,欢迎分享你的真知灼见!
878 58