MySQL的查询重写规则

本文涉及的产品
云数据库 RDS MySQL,集群系列 2核4GB
推荐场景:
搭建个人博客
RDS MySQL Serverless 基础系列,0.5-2RCU 50GB
云数据库 RDS PostgreSQL,集群系列 2核4GB
简介: 对于一些执行起来十分耗费性能的语句,MySQL 还是依据一些规则,竭尽全力的把这个很糟糕的语句转换成某种可以比较高效执行的形式,这个过程也可以被称作查询重写。

条件化简
我们编写的查询语句的搜索条件本质上是一个表达式,这些表达式可能比较
繁杂,或者不能高效的执行,MySQL的查询优化器会为我们简化这些表达式。

移除不必要的括号
有时候表达式里有许多无用的括号,比如这样:

((a = 5 AND b = c) OR ((a > c) AND (c < 5)))
看着就很烦,优化器会把那些用不到的括号给干掉,就是这样:

(a = 5 and b = c) OR (a > c AND c < 5)
常量传递(constant_propagation)
有时候某个表达式是某个列和某个常量做等值匹配,比如这样:

a = 5
当这个表达式和其他涉及列a的表达式使用AND连接起来时,可以将其他
表达式中的a的值替换为5,比如这样:

a = 5 AND b > a
就可以被转换为:

a = 5 AND b > 5
等值传递(equality_propagation)
有时候多个列之间存在等值匹配的关系,比如这样:

a = b and b = c and c = 5
这个表达式可以被简化为:

a = 5 and b = 5 and c = 5
移除没用的条件(trivial_condition_removal)
对于一些明显永远为TRUE或者FALSE的表达式,优化器会移除掉它们,比
如这个表达式:

(a < 1 and b = b) OR (a = 6 OR 5 != 5)
很明显,b=b这个表达式永远为TRUE,5!=5这个表达式永远为FALSE,所
以简化后的表达式就是这样的:

(a < 1 and TRUE) OR (a = 6 OR FALSE)
可以继续被简化为

a < 1 OR a = 6
表达式计算
在查询开始执行之前,如果表达式中只包含常量的话,它的值会被先计算出
来,比如这个:

a = 5 + 1
因为 5 + 1 这个表达式只包含常量,所以就会被化简成:

a = 6
但是这里需要注意的是,如果某个列并不是以单独的形式作为表达式的操作
数时,比如出现在函数中,出现在某个更复杂表达中,就像这样:

ABS(a) > 5
或者:

-a < -8
优化器是不会尝试对这些表达式进行化简的。只有搜索条件中
索引列和常数使用某些运算符连接起来才可能使用到索引,所以如果可以的话,
最好让索引列以单独的形式出现在表达式中。

常量表检测
MySQL觉得下边这两种查询运行的特别快:

使用主键等值匹配
使用唯一二级索引列等值匹配作为搜索条件来查询某个
表。
MySQL觉得这两种查询花费的时间特别少,少到可以忽略,所以也把通过这
两种方式查询的表称之为常量表(英文名:constant tables)。优化器在分析一
个查询语句时,先首先执行常量表查询,然后把查询中涉及到该表的条件全部替
换成常数,最后再分析其余表的查询成本,比方说这个查询语句:

select * from t_emp e,dept_emp d where e.emp_no=d.emp_no and e.emp_no='70249'
很明显,这个查询可以使用主键和常量值的等值匹配来查询t_emp表,也就
是在这个查询中t_emp表相当于常量表,在分析对dept_emp表的查询成本之前,
就会执行对t_emp表的查询,并把查询中涉及t_emp表的条件都替换掉,也就
是上边的语句会被转换成这样:

select t_emp表记录的各个字段的常量值,d.* from t_emp e,dept_emp d where d.emp_no='70249'
从explain的结果也可以看出对t_emp表的访问类型为const。

mysql> explain select * from t_emp e,dept_emp d where e.emp_no=d.emp_no and e.emp_no='70249';
+----+-------------+-------+------------+-------+---------------+---------+---------+-------+------+----------+-------------+
| id | select_type | table | partitions | type | possible_keys | key | key_len | ref | rows | filtered | Extra |
+----+-------------+-------+------------+-------+---------------+---------+---------+-------+------+----------+-------------+
| 1 | SIMPLE | e | NULL | const | PRIMARY | PRIMARY | 4 | const | 1 | 100.00 | NULL |
| 1 | SIMPLE | d | NULL | ref | PRIMARY | PRIMARY | 4 | const | 1 | 100.00 | Using where |
+----+-------------+-------+------------+-------+---------------+---------+---------+-------+------+----------+-------------+
2 rows in set, 1 warning (0.00 sec)
外连接消除
内连接的驱动表和被驱动表的位置可以相互转换,而左(外)
连接和右(外)连接的驱动表和被驱动表是固定的。这就导致内连接可能通过优
化表的连接顺序来降低整体的查询成本,而外连接却无法优化表的连接顺序。

外连接和内连接的本质区别就是:对于外连接的驱动表的记
录来说,如果无法在被驱动表中找到匹配ON子句中的过滤条件的记录,那么该
记录仍然会被加入到结果集中,对应的被驱动表记录的各个字段使用 NULL 值填
充;而内连接的驱动表的记录如果无法在被驱动表中找到匹配 ON 子句中的过滤
条件的记录,那么该记录会被舍弃。

只要我们在搜
索条件中指定关于被驱动表相关列的值不为NULL,那么外连接中在被驱动表中
找不到符合ON子句条件的驱动表记录也就被排除出最后的结果集了,也就是说:
在这种情况下:外连接和内连接也就没有什么区别了!

比方说这个查询:

mysql> SELECT * FROM e1 LEFT JOIN e2 ON e1.m1 = e2.m2 WHERE e2.n2 IS
NOT NULL;
由于指定了被驱动表e2的n2列不允许为NULL,所以上边的e1和e2表的
左(外)连接查询和内连接查询是一样的。当然,我们也可以不用显式的指定被
驱动表的某个列IS NOT NULL,只要隐含的有这个意思就行了,比方说这样:

SELECT * FROM e1 LEFT JOIN e2 ON e1.m1 = e2.m2 WHERE e2.m2 = 2;
在这个例子中,我们在WHERE子句中指定了被驱动表e2的m2列等于2,
也就相当于间接的指定了m2列不为NULL值,所以上边的这个左(外)连接查
询其实和下边这个内连接查询是等价的:

SELECT * FROM e1 INNER JOIN e2 ON e1.m1 = e2.m2 WHERE e2.m2 = 2;
我们把这种在外连接查询中,指定的WHERE子句中包含被驱动表中的列不
为NULL值的条件称之为空值拒绝(reject-NULL)。在被驱动表的WHERE
子句符合空值拒绝的条件后,外连接和内连接可以相互转换。这种转换带来的好
处就是查询优化器可以通过评估表的不同连接顺序的成本,选出成本最低的那种
连接顺序来执行查询。

相关实践学习
如何在云端创建MySQL数据库
开始实验后,系统会自动创建一台自建MySQL的 源数据库 ECS 实例和一台 目标数据库 RDS。
全面了解阿里云能为你做什么
阿里云在全球各地部署高效节能的绿色数据中心,利用清洁计算为万物互联的新世界提供源源不断的能源动力,目前开服的区域包括中国(华北、华东、华南、香港)、新加坡、美国(美东、美西)、欧洲、中东、澳大利亚、日本。目前阿里云的产品涵盖弹性计算、数据库、存储与CDN、分析与搜索、云通信、网络、管理与监控、应用服务、互联网中间件、移动服务、视频服务等。通过本课程,来了解阿里云能够为你的业务带来哪些帮助 &nbsp; &nbsp; 相关的阿里云产品:云服务器ECS 云服务器 ECS(Elastic Compute Service)是一种弹性可伸缩的计算服务,助您降低 IT 成本,提升运维效率,使您更专注于核心业务创新。产品详情: https://www.aliyun.com/product/ecs
目录
相关文章
|
1月前
|
缓存 关系型数据库 MySQL
MySQL索引策略与查询性能调优实战
在实际应用中,需要根据具体的业务需求和查询模式,综合运用索引策略和查询性能调优方法,不断地测试和优化,以提高MySQL数据库的查询性能。
|
3天前
|
SQL 关系型数据库 MySQL
MySQL 窗口函数详解:分析性查询的强大工具
MySQL 窗口函数从 8.0 版本开始支持,提供了一种灵活的方式处理 SQL 查询中的数据。无需分组即可对行集进行分析,常用于计算排名、累计和、移动平均值等。基本语法包括 `function_name([arguments]) OVER ([PARTITION BY columns] [ORDER BY columns] [frame_clause])`,常见函数有 `ROW_NUMBER()`, `RANK()`, `DENSE_RANK()`, `SUM()`, `AVG()` 等。窗口框架定义了计算聚合值时应包含的行。适用于复杂数据操作和分析报告。
37 11
|
7天前
|
存储 关系型数据库 MySQL
mysql怎么查询longblob类型数据的大小
通过本文的介绍,希望您能深入理解如何查询MySQL中 `LONG BLOB`类型数据的大小,并结合优化技术提升查询性能,以满足实际业务需求。
36 6
|
1月前
|
SQL 前端开发 关系型数据库
SpringBoot使用mysql查询昨天、今天、过去一周、过去半年、过去一年数据
SpringBoot使用mysql查询昨天、今天、过去一周、过去半年、过去一年数据
60 9
|
1月前
|
缓存 监控 关系型数据库
如何优化MySQL查询速度?
如何优化MySQL查询速度?【10月更文挑战第31天】
81 3
|
1月前
|
SQL NoSQL 关系型数据库
2024Mysql And Redis基础与进阶操作系列(5)作者——LJS[含MySQL DQL基本查询:select;简单、排序、分组、聚合、分组、分页等详解步骤及常见报错问题所对应的解决方法]
MySQL DQL基本查询:select;简单、排序、分组、聚合、分组、分页、INSERT INTO SELECT / FROM查询结合精例等详解步骤及常见报错问题所对应的解决方法
|
1月前
|
监控 关系型数据库 MySQL
数据库优化:MySQL索引策略与查询性能调优实战
【10月更文挑战第27天】本文深入探讨了MySQL的索引策略和查询性能调优技巧。通过介绍B-Tree索引、哈希索引和全文索引等不同类型,以及如何创建和维护索引,结合实战案例分析查询执行计划,帮助读者掌握提升查询性能的方法。定期优化索引和调整查询语句是提高数据库性能的关键。
238 1
|
1月前
|
SQL 关系型数据库 MySQL
定时任务频繁插入数据导致锁表问题 -> 查询mysql进程
定时任务频繁插入数据导致锁表问题 -> 查询mysql进程
47 1
|
1月前
|
监控 关系型数据库 MySQL
数据库优化:MySQL索引策略与查询性能调优实战
【10月更文挑战第26天】数据库作为现代应用系统的核心组件,其性能优化至关重要。本文主要探讨MySQL的索引策略与查询性能调优。通过合理创建索引(如B-Tree、复合索引)和优化查询语句(如使用EXPLAIN、优化分页查询),可以显著提升数据库的响应速度和稳定性。实践中还需定期审查慢查询日志,持续优化性能。
93 0
|
1月前
|
SQL 关系型数据库 MySQL
mysql编写sql脚本:要求表没有主键,但是想查询没有相同值的时候才进行插入
mysql编写sql脚本:要求表没有主键,但是想查询没有相同值的时候才进行插入
33 0
下一篇
DataWorks