【MySQL从入门到精通】【高级篇】(二十三)EXPLAIN的概述与table,id字段的剖析

本文涉及的产品
云数据库 RDS MySQL,集群系列 2核4GB
推荐场景:
搭建个人博客
RDS MySQL Serverless 基础系列,0.5-2RCU 50GB
云数据库 RDS PostgreSQL,集群系列 2核4GB
简介: 上一篇文章我们介绍了【MySQL从入门到精通】【高级篇】(二十二)慢查询日志分析,SHOW PROFILE查看SQL执行成本,这篇文章我们接着来介绍一下MySQL中一个非常重要的命令 EXPLAIN。当我们定位到查询慢的SQL之后,我们就可以使用EXPLAIN或DESCRIBE工具做针对性的分析查询语句。 DESCRIBE 语句的使用方法与EXPLAIN语句是一样的,并且分析结果也是一样的。

1. 简介

上一篇文章我们介绍了【MySQL从入门到精通】【高级篇】(二十二)慢查询日志分析,SHOW PROFILE查看SQL执行成本,这篇文章我们接着来介绍一下MySQL中一个非常重要的命令 EXPLAIN。当我们定位到查询慢的SQL之后,我们就可以使用EXPLAIN或DESCRIBE工具做针对性的分析查询语句。 DESCRIBE 语句的使用方法与EXPLAIN语句是一样的,并且分析结果也是一样的。

MySQL中有专门负责优化SELECT 语句的优化器模块,主要功能:通过分析系统中收集到的统计信息,为客户端请求的Query提供它认为最优的执行计划 (这部分最耗时)。


这个执行计划展示了接下来具体执行查询的方式,比如多表连接的顺序是什么,对于每个表采用什么访问方法来具体执行查询等等。MySQL为我们提供了EXPLAIN 语句来帮助我们查看某个查询语句的具体执行计划,大家看懂EXPLAIN 语句的各个输出项,可以针对性的提升我们查询语句的性能。

2. EXPLAIN能做什么?

表的读取顺序

数据读取操作的操作类型

哪些索引可以使用

哪些索引被实际使用

表之间的引用

每张表有多少行被优化器查询、

3. 官网介绍以及Explain的概述

MySQL的官方文档对MySQL做了一个详细的介绍。Explain的官网介绍

EXPLAIN 不仅可以作用于以SELECT 开头的查询语句,还可以作用于DELETE、INSERT、REPLACE以及UPDATE语句上。用来查看这些语句的执行计划,只是平时我们更多的用于对SELECT 语句的分析上。


需要注意的是:执行EXPLAIN时并没有真正的执行其后面的语句,因此可以安全的查看执行计划。

EXPLAIN语句输出的各个列的作用如下:

列名 描述
id 在一个大的查询语句中每个SELECT关键字都对应一个唯一的id
select_type SELECT 关键字对应的那个查询的类型
table 表名
partitions 匹配的分区信息
type 针对单表的访问方法
possible_keys 可能用到的索引
key 实际用到的索引
key_len 实际使用到的索引长度
ref 当使用索引列等值查询时,与索引列进行等值匹配的对象信息
rows 预估的需要读取的记录条数
filtered 某个表经过搜索条件过滤后剩余记录条数的百分比
Extra 一些重要的额外信息

这里先做一个整体的介绍,其中: select_typetypekeyExtra 这几列非常重要

4. 准备测试数据

4.1. 创建测试表

CREATE TABLE s1(
  id INT AUTO_INCREMENT,
  key1 VARCHAR(100),
  key2 INT,
  key3 VARCHAR(100),
  key_part1 VARCHAR(100),
  key_part2 VARCHAR(100),
  key_part3 VARCHAR(100),
  common_field VARCHAR(100),
  PRIMARY KEY(id),
  INDEX idx_key1(key1),
  UNIQUE INDEX uidx_key2(key2),
  INDEX idx_key3(key3),
  INDEX idx_key_part(key_part1,key_part2,key_part3)
) ENGINE=INNODB CHARSET=utf8;
CREATE TABLE s2(
    id INT AUTO_INCREMENT,
  key1 VARCHAR(100),
  key2 INT,
  key3 VARCHAR(100),
  key_part1 VARCHAR(100),
  key_part2 VARCHAR(100),
  key_part3 VARCHAR(100),
  common_field VARCHAR(100),
  PRIMARY KEY(id),
  INDEX idx_key1(key1),
  UNIQUE INDEX uidx_key2(key2),
  INDEX idx_key3(key3),
  INDEX idx_key_part(key_part1,key_part2,key_part3)
) ENGINE=INNODB CHARSET=utf8;

这里创建了两张一模一样的表,分别是表s1和表s2。并且在表s1中设置了主键索引id,普通索引idx_key1,唯一索引uidx_key2,以及组合索引idx_key_part。

4.2. 创建随机数函数以及存储过程

创建一个生成随机字符串的函数:

CREATE DEFINER=`baduser`@`%` FUNCTION `rand_string`(n INT) RETURNS varchar(255) CHARSET utf8 COLLATE utf8_unicode_ci
BEGIN
  DECLARE chars_str VARCHAR(100) DEFAULT 'abcdefghijklmnopqrstuvwxyzABCDEFGHIJKLMNOPQRSTUVWXYZ';
  DECLARE return_str VARCHAR(255) DEFAULT '';
  DECLARE i INT DEFAULT 0;
  WHILE i<n DO 
   SET return_str=CONCAT(return_str,SUBSTRING(chars_str,FLOOR(1+RAND()*52),1));
  SET i=i+1;
  END WHILE;
  RETURN return_str;
END

创建往s1表中插入数据的存储过程:

CREATE DEFINER=`baduser`@`%` PROCEDURE `insert_s1`(IN min_num INT(10),IN max_num INT(10))
BEGIN
  DECLARE i INT DEFAULT 0;
  SET autocommit=0;
  REPEAT
  SET i=i+1;
  INSERT INTO s1 VALUES(
   (min_num+i),
  rand_string(6),
  (min_num+30*i+5),
  rand_string(6),
  rand_string(10),
   rand_string(5),
  rand_string(10),
  rand_string(10));
    UNTIL i=max_num 
    END REPEAT;
    COMMIT;
END

创建往s2表中插入数据的存储过程:

CREATE DEFINER=`baduser`@`%` PROCEDURE `insert_s2`(IN min_num INT(10),IN max_num INT(10))
BEGIN
  DECLARE i INT DEFAULT 0;
  SET autocommit=0;
  REPEAT
  SET i=i+1;
  INSERT INTO s2 VALUES(
   (min_num+i),
  rand_string(6),
  (min_num+30*i+5),
  rand_string(6),
  rand_string(10),
   rand_string(5),
  rand_string(10),
  rand_string(10));
    UNTIL i=max_num 
    END REPEAT;
    COMMIT;
END

执行存储过程

-- 调用存储过程
CALL insert_s1(10001,10000);
CALL insert_s2(10001,10000);

这里给s1表和s2表分别插入10000。执行完成之后查看下s1表中的总记录数。


5. EXPLAIN 各列作用

5.1. table

首先介绍的列是table列,无论我们的查询有多么复杂,里面包含了多少个表,到最后也需要对每个表进行单表访问的,所以MySQL规定EXPLAIN语句输出的每条记录都对应着某个单表的访问方法, 该条记录的table列代表着该表的表名(有时不是真实的表名,可能是简称)

单表查询

EXPLAIN SELECT * FROM s1;

这个语句只涉及对s1表的单表查询,所以EXPLAIN 输出中只有一条记录,其中的table列的值是s1,表明这条记录是用来说明对s1表的单表记录是用来说明对s1表的单表访问方法的。

  1. 连接查询
-- s1:驱动表 s2:被驱动表
EXPLAIN SELECT * FROM s1 INNER JOIN s2;


这条语句是s1表和s2表的关联查询,所以需要查询两张表。

在看下有临时表的情况吧

EXPLAIN SELECT * FROM s1 UNION SELECT * FROM s2;

这里通过union关键字将两个查询联合起来。所以除了s1表和s2表以外,还多了一个临时表,这里的临时表的名字是<union 1,2>。

5.2 id

说完了table列,接下来说说 id列,在一个大的查询语句中每个SELECT 关键字都对应一个唯一的id。

单表查询的id列

EXPLAIN SELECT * FROM s1 WHERE key1='a';

单表查询很简单,就只有一条查询语句, 所以id值也就是1


关联查询的情况

是不是说,id值是累加的呢?多少个查询,id值就是多大?答案是否定的!!!!让我们来看下s1和s2的关联查询

EXPLAIN SELECT * FROM s1 INNER JOIN s2;

可以查看这两趟查询他们的id值是一样的,也就是说并不是多少次查询id值就累加到多少。id值一样的话可以认为是一组,从上往下顺序执行。


子查询的情况

EXPLAIN SELECT * FROM s1 WHERE key1 IN(SELECT key1 FROM s2) OR key3='a';

这里有个两个查询,一个主查询查s1表,一个子查询查s2表,按照常识我们可以知道子查询先执行,观察到子查询的id值为2。这就说明id值越大的表示越优先执行。

来看下另外一种子查询的情况

EXPLAIN SELECT * FROM s1 WHERE key1 IN(SELECT key3 FROM s2);

这里有三个查询,分别是主查询s1表,子查询s2表,以及中间表。

特殊情况说明

EXPLAIN SELECT * FROM s1 WHERE key1 IN(SELECT key2 FROM s2 WHERE common_field='a');

大家看到这sql语句猜想一下这里有几个查询,每个查询的id值是多少。如果单从sql语句出发,我们会习惯性的认为这里有两个查询,其中,一个主查询,一个子查询,子查询的id为2,主查询的id为1。那么实际情况是不是这样的呢?

很遗憾,答案是否定的!!!

这里的结果跟前面的s1和s2的关联查询结果一模一样,这就是因为 查询优化器可能对涉及子查询的查询语句进行重写,转成了多表查询的操作。

EXPLAIN SELECT * FROM s1 UNION SELECT * FROM s2;

这里有三个查询,分别是驱动表s1的主查询,被驱动表s2的联合查询,以及临时表<union1,2> 这里临时表的作用是将s1和s2的查询结果去重,它不算一个表查询。

比较 UNION ALL 的使用大家就有一个清晰的认识。

EXPLAIN SELECT * FROM s1 UNION ALL SELECT * FROM s2;

由于UNION ALL 关键字没有去重的效果,所以,它不需要临时表。

小结

id 如果相同,可以认为是一组,从上往下顺序执行

在所有组中,id值越大,优先级越高,越先执行

关注点:id号每个号码,表示一趟独立的查询,一个sql的查询趟数越少越好

总结

本文对EXPLAIN命令做了一个详细的介绍,EXPLAIN 命令是分析慢查询SQL的利器,通过它我们可以窥探SQL的执行情况,从而为我们进行SQL优化提供指导意义。接着,我们详细介绍了table列和id列的含义和各种情况的说明。


相关实践学习
如何快速连接云数据库RDS MySQL
本场景介绍如何通过阿里云数据管理服务DMS快速连接云数据库RDS MySQL,然后进行数据表的CRUD操作。
全面了解阿里云能为你做什么
阿里云在全球各地部署高效节能的绿色数据中心,利用清洁计算为万物互联的新世界提供源源不断的能源动力,目前开服的区域包括中国(华北、华东、华南、香港)、新加坡、美国(美东、美西)、欧洲、中东、澳大利亚、日本。目前阿里云的产品涵盖弹性计算、数据库、存储与CDN、分析与搜索、云通信、网络、管理与监控、应用服务、互联网中间件、移动服务、视频服务等。通过本课程,来了解阿里云能够为你的业务带来哪些帮助 &nbsp; &nbsp; 相关的阿里云产品:云服务器ECS 云服务器 ECS(Elastic Compute Service)是一种弹性可伸缩的计算服务,助您降低 IT 成本,提升运维效率,使您更专注于核心业务创新。产品详情: https://www.aliyun.com/product/ecs
相关文章
|
1月前
|
存储 缓存 关系型数据库
MySQL底层概述—9.ACID与事务
本文介绍了数据库事务的ACID特性(原子性、一致性、隔离性、持久性),以及事务控制的演进过程,包括排队、排它锁、读写锁和MVCC(多版本并发控制)。文章详细解释了每个特性的含义及其在MySQL中的实现方式,并探讨了事务隔离级别的类型及其实现机制。重点内容包括:ACID特性(原子性、持久性、隔离性和一致性的定义及其实现方式)、事务控制演进(从简单的全局排队到复杂的MVCC,逐步提升并发性能)、MVCC机制(通过undo log多版本链和Read View实现高效并发控制)、事务隔离级别(析了四种隔离级别(读未提交、读已提交、可重复读、可串行化)的特点及适用场景)、隔离级别与锁的关系。
|
1月前
|
存储 SQL 关系型数据库
MySQL底层概述—2.InnoDB磁盘结构
InnoDB磁盘结构主要包括表空间(Tablespaces)、数据字典(Data Dictionary)、双写缓冲区(Double Write Buffer)、重做日志(redo log)和撤销日志(undo log)。其中,表空间分为系统、独立、通用、Undo及临时表空间,分别用于存储不同类型的数据。数据字典从MySQL 8.0起不再依赖.frm文件,转而使用InnoDB引擎存储,支持事务原子性DDL操作。
224 100
MySQL底层概述—2.InnoDB磁盘结构
|
1月前
|
缓存 算法 关系型数据库
MySQL底层概述—1.InnoDB内存结构
本文介绍了InnoDB引擎的关键组件和机制,包括引擎架构、Buffer Pool、Page管理机制、Change Buffer、Log Buffer及Adaptive Hash Index。
235 97
MySQL底层概述—1.InnoDB内存结构
|
2月前
|
SQL 关系型数据库 MySQL
网安入门之MySQL后端基础
《网安入门之MySQL后端基础》简介: 本文介绍了数据库及MySQL的基础知识,涵盖数据库的概念、结构与操作。数据库是组织化存储数据的集合,通过表、列、行等结构实现高效管理。MySQL作为开源的关系型数据库管理系统,广泛应用于Web开发。文中详细讲解了MySQL的基本操作,如增(INSERT)、删(DELETE)、改(UPDATE)、查(SELECT)等语句的使用方法,并介绍了数据库事务的ACID特性。此外,还探讨了SQL注入攻击的风险及防范措施,强调了预处理语句的重要性。最后,简述了PHP中mysqli扩展的使用方法,包括连接数据库、执行查询和关闭连接等步骤。
|
27天前
|
SQL 关系型数据库 MySQL
MySQL底层概述—10.InnoDB锁机制
本文介绍了:锁概述、锁分类、全局锁实战、表级锁(偏读)实战、行级锁升级表级锁实战、间隙锁实战、临键锁实战、幻读演示和解决、行级锁(偏写)优化建议、乐观锁实战、行锁原理分析、死锁与解决方案
MySQL底层概述—10.InnoDB锁机制
|
1月前
|
缓存 算法 关系型数据库
MySQL底层概述—8.JOIN排序索引优化
本文主要介绍了MySQL中几种关键的优化技术和概念,包括Join算法原理、IN和EXISTS函数的使用场景、索引排序与额外排序(Using filesort)的区别及优化方法、以及单表和多表查询的索引优化策略。
MySQL底层概述—8.JOIN排序索引优化
|
1月前
|
SQL 关系型数据库 MySQL
MySQL底层概述—7.优化原则及慢查询
本文主要介绍了:Explain概述、Explain详解、索引优化数据准备、索引优化原则详解、慢查询设置与测试、慢查询SQL优化思路
110 15
MySQL底层概述—7.优化原则及慢查询
|
1月前
|
存储 关系型数据库 MySQL
MySQL底层概述—6.索引原理
本文详细回顾了:索引原理、二叉查找树、平衡二叉树(AVL树)、红黑树、B-Tree、B+Tree、Hash索引、聚簇索引与非聚簇索引。
MySQL底层概述—6.索引原理
|
1月前
|
存储 缓存 关系型数据库
MySQL底层概述—5.InnoDB参数优化
本文介绍了MySQL数据库中与内存、日志和IO线程相关的参数优化,旨在提升数据库性能。主要内容包括: 1. 内存相关参数优化:缓冲池内存大小配置、配置多个Buffer Pool实例、Chunk大小配置、InnoDB缓存性能评估、Page管理相关参数、Change Buffer相关参数优化。 2. 日志相关参数优化:日志缓冲区配置、日志文件参数优化。 3. IO线程相关参数优化: 查询缓存参数、脏页刷盘参数、LRU链表参数、脏页刷盘相关参数。
MySQL底层概述—5.InnoDB参数优化
|
1月前
|
存储 SQL 关系型数据库
MySQL底层概述—4.InnoDB数据文件
本文介绍了InnoDB表空间文件结构及其组成部分,包括表空间、段、区、页和行。表空间是最高逻辑层,包含多个段;段由若干个区组成,每个区包含64个连续的页,页用于存储多条行记录。文章还详细解析了Page结构,分为通用部分(文件头与文件尾)、数据记录部分和页目录部分。此外,文中探讨了行记录格式,包括四种行格式(Redundant、Compact、Dynamic和Compressed),重点介绍了Compact行记录格式及其溢出机制。最后,文章解释了不同行格式的特点及应用场景,帮助理解InnoDB存储引擎的工作原理。
MySQL底层概述—4.InnoDB数据文件