条件简化&子查询(1)--Mysql基于规则优化(四十四)

本文涉及的产品
RDS MySQL DuckDB 分析主实例,集群系列 4核8GB
RDS DuckDB + QuickBI 企业套餐,8核32GB + QuickBI 专业版
RDS AI 助手,专业版
简介: 条件简化&子查询(1)--Mysql基于规则优化(四十四)

上篇文章说了统计数据可以用show table status和show index from 表名查看,可以存着永久性和非永久性,innodb_stats_persistent控制着是否开启永久性,innoDb_stats_persistent_sample_pages和innoDB_stats_transient_sample_pages可以控制采集页面统计,innoDb_stats_auto_recalc控制是否自动计算,都可以在创建表的时候设置。

innoDB_stats_method控制如何对待null值。

连接查询成本(2)---mysql进阶(四十二)


基于规则优化


有的时候,会有一些不是很好的sql语句,但mysql依然会把这些sql优化成较高性能来执行,这可以称查询重写。

条件简化

比如表达式会给我们移除一些不必要的括号,

((a = 5 AND b = c) OR ((a > c) AND (c < 5)))

修改为

(a = 5 and b = c) OR (a > c AND c < 5)

还会常量传递,

a = 5 AND b > a

改为

a = 5 AND b > 5

还有等值传递,

a = b and b = c and c = 5

改为

a = 5 and b = 5 and c = 5

还有移除没用条件,

(a < 1 and b = b) OR (a = 6 OR 5 != 5)

很明显这里面有两个条件已经知道是true和false了,所以可以优化成

(a < 1 and TRUE) OR (a = 6 OR FALSE)

继续优化

a < 1 OR a = 6

表达式计算:

a = 5 + 1

会直接修改为:

a = 6

如果是复杂一点的则不会优化,比如有函数什么的。

Having和where语句合并,如果查询语句里没有sum,max等聚集函数及其group by,优化器会合并他们。


常量表检测:

查询表中只有一条或者没有数据。(虽然没查,但怎么知道有多少数据呢,别忘了我们在查询之前计算成本会用到数据统计,但innoDB查询出来的不准确,是估值,所以这里一条只使用memory和myISAM)

使用主键等值匹配或者唯一二级索引等值匹配查询表。

也就是如果连接查询中,如何其中一个是常量查询,const方法访问数据库,会直接查询出来,然后在计算成本。


外连接消除

我们回顾一下,内连接和外连接的区别,内连接用on查询出过滤条件如果无法满足是会直接舍弃的,而且驱动表和被驱动表是可以优化的,而外连接分为左连接和右连接,若on的条件不满足,则被驱动表的数据也会查询出来,显示为null。

但如果我们在外连接里面,在加一个where条件,比如说where 某列不等于null,这时候null就会移除,也就是说,这时候查询的数据内连接和外连接其实返回的都是一样的,我们也不用明确的指明不为null,也可以where 某列= 2,这时候也不会查询出某列为null。这时候会优化表的查询顺序,选出最优执行计划。


子查询语法

说子查询优化之前,我们先说一下子查询,在一个查询的某一个位子页可以有另一个查询,这就是子查询,而外层的查询我们称为外查询,

SELECT (SELECT m1 FROM t1 LIMIT 1);

这里就是子查询,

SELECT m, n FROM (SELECT m2 + 1 AS m, n2 AS n FROM t2 WHERE m2 > 2) AS t;

这里也是子查询,吧子查询看做一个表,表名为t,表字段为m和n。

SELECT * FROM t1 WHERE m1 IN (SELECT m2 FROM t2);

吧子查询放在外层查询用where和on最常用,

SELECT * FROM t1 WHERE m1 IN (SELECT m2 FROM t2);

这个查询m1属于哪些值。

按返回的结果集区分子查询

因为子查询本身也是查询,可以吧子查询返回的不同数据分为不同的子查询类型。


1、标量子查询,

SELECT (SELECT m1 FROM t1 LIMIT 1);
SELECT * FROM t1 WHERE m1 = (SELECT MIN(m2) FROM t2);

返回单一值的查询。

行子查询,顾名思义,返回一条记录的子查询

SELECT * FROM t1 WHERE (m1, n1) = (SELECT m2, n2 FROM t2 LIMIT 1);

列子查询,就是返回一列的 子查询,

SELECT * FROM t1 WHERE m1 IN (SELECT m2 FROM t2);

表子查询,返回很多行很多列

SELECT * FROM t1 WHERE (m1, n1) IN (SELECT m2, n2 FROM t2);


按照外层关系来区分子查询

不相关子查询:如果子查询结果不依赖外层查询的值,就叫不相关子查询。我们前面的都是不相关子查询。

相关子查询:如果依赖外层查询的值,就叫相关子查询。

SELECT * FROM t1 WHERE m1 IN (SELECT m2 FROM t2 WHERE n1 = n2);

子查询在布尔表达式中的作用

布尔表达式的操作符是什么呢?= ,>,<,<>,<=>,!=

我们吧这些操作符称为comparison_operation,所以子查询用布尔表达式可以是这样,

这是标量子查询,

SELECT * FROM t1 WHERE m1 < (SELECT MIN(m2) FROM t2);

这是行子查询

SELECT * FROM t1 WHERE (m1, n1) = (SELECT m2, n2 FROM t2 LIMIT 1);

注意:这里只能返回标量和行子查询,否则这里会报错。


IN/NOT IN/ANY/SOME/ALL子查询

In和not in,这个布尔表达式的意思是用来判断某个操作数在不在由子查询结果集组成的集合中,

SELECT * FROM t1 WHERE (m1, n1) IN (SELECT m2, n2 FROM t2);


ANY/SOME

Any和some是同义词,

SELECT * FROM t1 WHERE m1 > ANY(SELECT m2 FROM t2);

这里的意思就是子查询返回的值如果小于m1就是true,否则就是false,所以这里查询等价于

SELECT * FROM t1 WHERE m1 > (SELECT MIN(m2) FROM t2);

注意这是min(m2)


All:

SELECT * FROM t1 WHERE m1 > ALL(SELECT m2 FROM t2);

这个sql的意思是m1必须大于子查询里的所有返回集,所以他等价于大于他返回的最大数:

SELECT * FROM t1 WHERE m1 > (SELECT MAX(m2) FROM t2);

注意这是max(m2)

Exists子查询:

有时候我们需要判断数据是否有记录,可以使用exists

SELECT * FROM t1 WHERE EXISTS (SELECT 1 FROM t2);

对于子查询来说,我们并不关系子查询返回的结果集,我们关系的是子查询结果集是否存在记录,只要子查询有记录,那么整个表达式就是true。

当子查询没数据的时候,就直接返回false。

mysql> SELECT * FROM t1 WHERE EXISTS (SELECT * FROM t2 where t2.m2 = '5');
Empty set (0.00 sec)
相关实践学习
每个IT人都想学的“Web应用上云经典架构”实战
本实验从Web应用上云这个最基本的、最普遍的需求出发,帮助IT从业者们通过“阿里云Web应用上云解决方案”,了解一个企业级Web应用上云的常见架构,了解如何构建一个高可用、可扩展的企业级应用架构。
MySQL数据库入门学习
本课程通过最流行的开源数据库MySQL带你了解数据库的世界。 &nbsp; 相关的阿里云产品:云数据库RDS MySQL 版 阿里云关系型数据库RDS(Relational Database Service)是一种稳定可靠、可弹性伸缩的在线数据库服务,提供容灾、备份、恢复、迁移等方面的全套解决方案,彻底解决数据库运维的烦恼。 了解产品详情:&nbsp;https://www.aliyun.com/product/rds/mysql&nbsp;
相关文章
|
12月前
|
SQL 缓存 关系型数据库
MySQL 慢查询是怎样优化的
本文深入解析了MySQL查询速度变慢的原因及优化策略,涵盖查询缓存、执行流程、SQL优化、执行计划分析(如EXPLAIN)、查询状态查看等内容,帮助开发者快速定位并解决慢查询问题。
448 0
|
10月前
|
缓存 关系型数据库 MySQL
降低MySQL高CPU使用率的优化策略。
通过上述方法不断地迭代改进,在实际操作中需要根据具体场景做出相对合理判断。每一步改进都需谨慎评估其变动可能导致其他方面问题,在做任何变动前建议先在测试环境验证其效果后再部署到生产环境中去。
384 6
|
11月前
|
存储 SQL 关系型数据库
MySQL 核心知识与索引优化全解析
本文系统梳理了 MySQL 的核心知识与索引优化策略。在基础概念部分,阐述了 char 与 varchar 在存储方式和性能上的差异,以及事务的 ACID 特性、并发事务问题及对应的隔离级别(MySQL 默认 REPEATABLE READ)。 索引基础部分,详解了 InnoDB 默认的 B+tree 索引结构(多路平衡树、叶子节点存数据、双向链表支持区间查询),区分了聚簇索引(数据与索引共存,唯一)和二级索引(数据与索引分离,多个),解释了回表查询的概念及优化方法,并分析了 B+tree 作为索引结构的优势(树高低、效率稳、支持区间查询)。 索引优化部分,列出了索引创建的六大原则
274 2
|
存储 SQL 关系型数据库
京东面试:mysql深度分页 严重影响性能?根本原因是什么?如何优化?
京东面试:mysql深度分页 严重影响性能?根本原因是什么?如何优化?
京东面试:mysql深度分页 严重影响性能?根本原因是什么?如何优化?
|
11月前
|
存储 SQL 关系型数据库
MySQL 动态分区管理:自动化与优化实践
本文介绍了如何利用 MySQL 的存储过程与事件调度器实现动态分区管理,自动化应对数据增长,提升查询性能与数据管理效率,并详细解析了分区创建、冲突避免及实际应用中的关键注意事项。
457 0
|
存储 关系型数据库 MySQL
MySQL细节优化:关闭大小写敏感功能的方法。
通过这种方法,你就可以成功关闭 MySQL 的大小写敏感功能,让你的数据库操作更加便捷。
1145 19
|
SQL 关系型数据库 MySQL
基于SQL Server / MySQL进行百万条数据过滤优化方案
对百万级别数据进行高效过滤查询,需要综合使用索引、查询优化、表分区、统计信息和视图等技术手段。通过合理的数据库设计和查询优化,可以显著提升查询性能,确保系统的高效稳定运行。
847 9
|
9月前
|
缓存 关系型数据库 BI
使用MYSQL Report分析数据库性能(下)
使用MYSQL Report分析数据库性能
543 158
|
9月前
|
关系型数据库 MySQL 数据库
自建数据库如何迁移至RDS MySQL实例
数据库迁移是一项复杂且耗时的工程,需考虑数据安全、完整性及业务中断影响。使用阿里云数据传输服务DTS,可快速、平滑完成迁移任务,将应用停机时间降至分钟级。您还可通过全量备份自建数据库并恢复至RDS MySQL实例,实现间接迁移上云。
|
9月前
|
关系型数据库 MySQL 数据库
阿里云数据库RDS费用价格:MySQL、SQL Server、PostgreSQL和MariaDB引擎收费标准
阿里云RDS数据库支持MySQL、SQL Server、PostgreSQL、MariaDB,多种引擎优惠上线!MySQL倚天版88元/年,SQL Server 2核4G仅299元/年,PostgreSQL 227元/年起。高可用、可弹性伸缩,安全稳定。详情见官网活动页。
1439 152

推荐镜像

更多