一文搞懂MySQL中一条SQL语句是如何执行的

本文涉及的产品
RDS MySQL DuckDB 分析主实例,基础系列 4核8GB
RDS DuckDB + QuickBI 企业套餐,8核32GB + QuickBI 专业版
RDS MySQL DuckDB 分析主实例,集群系列 4核8GB
简介: 一文搞懂MySQL中一条SQL语句是如何执行的

曾在面试中被问过这样的问题:

SELECT * FROM A WHERE B=1 AND C=2 GROUP BY D ORDER BY D在MySQL中是如何执行的?

因为没有专门的研究过这个问题,因此当时答的不是很好,所以想利用专门的时间来研究下这个内容,只有了解了SQL是如何执行的,才能够写出更好的SQL。

1 SQL执行总体过程

如图:先后顺序就是从上到下

  • Client层:接收用户输入的SQL,显示响应的结果
  • Server层:对SQL进行格式的校验、语言分析、优化和执行,并对执行结果进行返回
  • 连接器:用户的认证和授权,对接口进行链接
  • 缓存:对查询结果进行缓存,并在对缓存进行查询时返回命中结果
  • 分析器:SQL的词法分析和语法分析
  • 优化器:生成SQL执行计划,操作索引进行数据的查询
  • 执行器:操作引擎,利用文件系统返回查询结果
  • 文件系统层:对数据进行持久化

2 总体过程剖析

2.1 客户端和连接器

客户端这个词颇有些深意,比如我们常用来操作MySQL的Navicat、MyDB Studio、MySQL WorkBench等等,很好,我现在告诉你,他们都不是MySQL的客户端,意不意外?它们只能称为MySQL的客户端连接工具或可视化工具。

而真正意义上的MySQL客户端则是一个较为完整的Project,编译后可以是一个可执行文件,可以直接与MySQL Server进行连接和通信,比如Windows操作系统下的:

我们可以直接操作这个程序与MySQL Server进行交互,这就是MySQL Client。

现在我们看下连接器,首先是连接MySQL Server的操作:

连接MySQL的语法:

mysql -h [host,默认为127.0.0.1] -u [用户名] -P [端口号,默认3306] -p

查看连接器都有哪些连接:

2.2 分析器

分析器主要负责SQL的语法分析和语义分析,对SQL进行初步的查验操作。

语法分析:

简单的讲语法分析就是检查SQL是否符合MySQL的语法关键字,比如SELECT * FROM A WHERE B=C给写成了SELECT FROM * A WHERE B=C,这就会导致语法分析错误,例如:

语义分析(也叫词法分析):

就是判断除了SQL关键字顺序之外的其他语句词汇符不符合当前的查询条件,比如FROM A,表A却不存在,SELECT B,字段B不存在等等,例如:

语法检查顺序

SELECT 
FROM
JOIN
ON
WHERE
GROUP BY
HAVING
UNION
ORDER BY
LIMIT
2.3 缓存

通常我们执行成功后的语句和结果(仅限查询语句),MySQL会进行缓存,当我们再次对该语句进行查询时,则会先查询缓存,查看是否命中。

在my.ini配置文件中我们可以设置MySQL缓存的大小和是否开启缓存:

2.4 优化器

这一步MySQL会帮助我们选择最优的查询方式,索引类型,确定执行方案

优化器是在表中有多个索引的时候MySQL优化器会按照最小成本的原则(IO成本+CPU成本)决定使用哪个索引,或者有多表关联(join)的时候决定各个表的连接顺序。

2.5 执行器和文件系统

首先是执行器,调用执行接口将优化器优化后的SQL连接文件系统进行执行。

执行顺序:

FROM
ON
JOIN
WHERE
GROUP BY
HAVING
SELECT
DISTINCT
UNION
ORDER BY

然后是文件系统,也叫存储引擎,分为内存数据和磁盘数据,因为为了快速查询一些数据,MySQL可以启用内存来存取数据,同样和缓存一样,内存区的大小也可以在my.ini配置文件中进行设置。

MySQL的文件系统并不单单是存放文件的作用,还有记录日志和维护事务功能的作用,比如常见的redo log 、undo log和bin log日志都是由执行器联合存储引擎进行生成和维护的。

3 回到面试题

SELECT * FROM A WHERE B=1 AND C=2 GROUP BY D ORDER BY D,因为是单表查询,而且在WHERE过滤的时候也比较简单,因此我们用流程图来表示下:

4 总结

一条SQL的执行过程能够帮助我们更好的了解MySQL内部的执行情况,但是对于SQL的优化而言,我们了解的知识还需要更多,比如使用explain 查看SQL的执行计划,再针对执行计划对SQL进行进一步的优化等等我们都没有讲到,但是大多数的SQL可能并不需要优化,因此我们针对SQL的执行流程在基本的使用上也是能够帮助我们写出更优雅的SQL的。

相关实践学习
每个IT人都想学的“Web应用上云经典架构”实战
本实验从Web应用上云这个最基本的、最普遍的需求出发,帮助IT从业者们通过“阿里云Web应用上云解决方案”,了解一个企业级Web应用上云的常见架构,了解如何构建一个高可用、可扩展的企业级应用架构。
MySQL数据库入门学习
本课程通过最流行的开源数据库MySQL带你了解数据库的世界。   相关的阿里云产品:云数据库RDS MySQL 版 阿里云关系型数据库RDS(Relational Database Service)是一种稳定可靠、可弹性伸缩的在线数据库服务,提供容灾、备份、恢复、迁移等方面的全套解决方案,彻底解决数据库运维的烦恼。 了解产品详情: https://www.aliyun.com/product/rds/mysql 
相关文章
|
7月前
|
关系型数据库 MySQL 数据库
阿里云数据库RDS费用价格:MySQL、SQL Server、PostgreSQL和MariaDB引擎收费标准
阿里云RDS数据库支持MySQL、SQL Server、PostgreSQL、MariaDB,多种引擎优惠上线!MySQL倚天版88元/年,SQL Server 2核4G仅299元/年,PostgreSQL 227元/年起。高可用、可弹性伸缩,安全稳定。详情见官网活动页。
1253 152
|
7月前
|
SQL 存储 关系型数据库
MySQL体系结构详解:一条SQL查询的旅程
本文深入解析MySQL内部架构,从SQL查询的执行流程到性能优化技巧,涵盖连接建立、查询处理、执行阶段及存储引擎工作机制,帮助开发者理解MySQL运行原理并提升数据库性能。
|
7月前
|
关系型数据库 MySQL 数据库
阿里云数据库RDS支持MySQL、SQL Server、PostgreSQL和MariaDB引擎
阿里云数据库RDS支持MySQL、SQL Server、PostgreSQL和MariaDB引擎,提供高性价比、稳定安全的云数据库服务,适用于多种行业与业务场景。
929 156
|
7月前
|
SQL 监控 关系型数据库
SQL优化技巧:让MySQL查询快人一步
本文深入解析了MySQL查询优化的核心技巧,涵盖索引设计、查询重写、分页优化、批量操作、数据类型优化及性能监控等方面,帮助开发者显著提升数据库性能,解决慢查询问题,适用于高并发与大数据场景。
|
7月前
|
关系型数据库 分布式数据库 数据库
阿里云数据库收费价格:MySQL、PostgreSQL、SQL Server和MariaDB引擎费用整理
阿里云数据库提供多种类型,包括关系型与NoSQL,主流如PolarDB、RDS MySQL/PostgreSQL、Redis等。价格低至21元/月起,支持按需付费与优惠套餐,适用于各类应用场景。
|
7月前
|
SQL 监控 关系型数据库
查寻MySQL或SQL Server的连接数,并配置超时时间和最大连接量
以上步骤提供了直观、实用且易于理解且执行的指导方针来监管和优化数据库服务器配置。务必记得,在做任何重要变更前备份相关配置文件,并确保理解每个参数对系统性能可能产生影响后再做出调节。
719 11
|
7月前
|
缓存 关系型数据库 BI
使用MYSQL Report分析数据库性能(下)
使用MYSQL Report分析数据库性能
496 158
|
7月前
|
关系型数据库 MySQL 数据库
自建数据库如何迁移至RDS MySQL实例
数据库迁移是一项复杂且耗时的工程,需考虑数据安全、完整性及业务中断影响。使用阿里云数据传输服务DTS,可快速、平滑完成迁移任务,将应用停机时间降至分钟级。您还可通过全量备份自建数据库并恢复至RDS MySQL实例,实现间接迁移上云。
|
7月前
|
缓存 监控 关系型数据库
使用MYSQL Report分析数据库性能(中)
使用MYSQL Report分析数据库性能
524 156