MySQL - 一条SQL在MySQL中是如何被执行的?

本文涉及的产品
云数据库 RDS MySQL Serverless,0.5-2RCU 50GB
云数据库 RDS MySQL Serverless,价值2615元额度,1个月
简介: MySQL - 一条SQL在MySQL中是如何被执行的?

1. 前言

MySQL 中针对表的操作可以分为增、删、改、查四种操作,也就是我们所说的 CRUD 大法,根据类型分为DML(增删改)和DQL(查),不管是 DML 和 DQL 都要经过连接器、查询缓存、分析器、优化器、执行器调用存储引擎的API执行最优路径。前四个阶段流程都是一样的,接下来我们一起学习执行器在存储引擎上是如何进行查询和更新(增删改查)的。

PS:查询缓存在 MySQL5.7.20 版本已过时,在 MySQL8.0 版本中被移除,这里不再单独介绍查询缓存这一流程;连接器、查询缓存、分析器、优化器、执行器的具体作用见:一文了解MySQL的基础架构及各个组件的作用。

2. MySQL是如何执行查询语句的?

如下SQL:实现查询名字为 “javaBoy001” 和年龄为 18 的用户

select id, name, sex, age from user where name = 'javaBoy001' and age = 18;

2.1 连接器

先检查该语句是否有权限,如果没有权限,直接返回错误信息。

2.2 分析器

分析器会通过词法分析,提取 SQL 语句的关键字,比如提取上面 SQL 语句的 “select”、“from”、"where"等,并可以知道这是一条查询语句,提取查询的表名为 user,提取查询的条件为 name = ‘javaBoy001’ and age = 18。

然后根据词法分析的结果,语法分析器会根据语法规则,判断你输入的SQL语句是否满足MySQL语法,没问题的执行下一步。

2.3 优化器

MySQL判断出了一条SQL语句要做什么之后,对其进行各种优化,包括重写查询语句、选择合适的索引、表的读取顺序等确定执行方案。上面的 SQL 语句存在两种执行方案:

方案1. 先查询名字为javaBoy001的所有用户,再查询年龄为18的用户;

方案2. 先查询年龄为18的用户,再查询名字为javaBoy001的所有用户;

因此,优化器需根据自己的优化算法选择自己认为执行效率最高的一个方案(优化器认为不一定是最好)。

2.4 执行器

语句经过优化后,就要进入执行阶段,开始执行的时候,要先判断权限,如果没有,就返回没有权限的错误。如果有权限,就调用存储引擎的API,返回查询结果。

3. MySQL是如何执行更新语句的?

如下SQL:实现更新名字为 “javaBoy001” 和年龄为 18 用户的手机号为 “15211111111”

update user set phone = '15211111111' where name = 'javaBoy001' and age = 18;

3.1 连接器

先检查该语句是否有权限,如果没有权限,直接返回错误信息。

3.2 分析器

分析器会通过词法分析和语法分析知道这是一条更新语句。

3.3 优化器

MySQL判断出了一条SQL语句要做什么之后,对其进行各种优化,选择合适的索引等。

3.4 执行器

语句经过优化后,就要进入执行阶段,开始执行的时候,要先判断权限,如果没有,就返回没有权限的错误。如果有权限,就调用存储引擎的API操作数据。

3.5 存储引擎更新数据

  1. InnoDB 存储引擎有一个缓冲池(Buffer Pool),查询时缓冲池里有数据就不去读取磁盘,没有就会把数据直接从磁盘里加载到缓冲池(Buffer Pool),同时加独占锁
  2. 写入数据的旧值(原有的值)到 undo_log,实现事务的原子性,提供回滚操作。
  3. 更新 Buffer Pool 中的缓存数据为新数据,此时这个新值为脏数据,因为磁盘为旧值。
  4. 为了防止 MySQL 服务器宕机,Buffer Pool 内存中的数据丢失,把 Buffer Pool 更新新值的操作写入 Redo log Buffer,这时的 redo_log 还仅仅停留在内存缓冲里。

如果还没提交事务,如果 MySQL 宕机,必然会导致 Buffer Pool 中的数据丢失,同时写入 Redo Log Buffer 中的redo_log 也会丢失。

而此时丢失的数据其实无关紧要,因为事务没有提交,则代表此次更新操作没有成功,MySQL 宕机导致内存里的数据丢失,但磁盘上的数据还是原来的值,重启 MySQL 后,数据并没有改变。

  1. 如果想要提交一个事务,此时就会根据一定的策略把 redo_log 从 redo log buffer 里刷入到磁盘,这个策略是根据 innodb_flush_log_at_trx_commit 来配置的:

(1)值为0:提交事务时,不会把 redo log buffer 里的数据刷入磁盘,MySQL 宕机,内存中的数据和 redo_log 都会丢失。

(2)值为1:提交事务时,一定会把 redo log buffer 从内存刷入到磁盘,MySQL 宕机,可以通过 redo_log 进行数据恢复。

(3)值为2:提交事务时,把 redo_log 写入磁盘文件对应的 os cache 缓存里,每隔1秒后才会把 os cache 里的数据写入到磁盘文件里。MySQL 宕机,会丢失 1s 内的更新数据。

相关实践学习
基于CentOS快速搭建LAMP环境
本教程介绍如何搭建LAMP环境,其中LAMP分别代表Linux、Apache、MySQL和PHP。
全面了解阿里云能为你做什么
阿里云在全球各地部署高效节能的绿色数据中心,利用清洁计算为万物互联的新世界提供源源不断的能源动力,目前开服的区域包括中国(华北、华东、华南、香港)、新加坡、美国(美东、美西)、欧洲、中东、澳大利亚、日本。目前阿里云的产品涵盖弹性计算、数据库、存储与CDN、分析与搜索、云通信、网络、管理与监控、应用服务、互联网中间件、移动服务、视频服务等。通过本课程,来了解阿里云能够为你的业务带来哪些帮助     相关的阿里云产品:云服务器ECS 云服务器 ECS(Elastic Compute Service)是一种弹性可伸缩的计算服务,助您降低 IT 成本,提升运维效率,使您更专注于核心业务创新。产品详情: https://www.aliyun.com/product/ecs
相关文章
|
10天前
|
SQL 关系型数据库 MySQL
【MySQL系列笔记】常用SQL
常用SQL分为三种类型,分别为DDL,DML和DQL;这三种类型的SQL语句分别用于管理数据库结构、操作数据、以及查询数据,是数据库操作中最常用的语句类型。 在后面学习的多表联查中,SQL是分析业务后业务后能否实现的基础,以及后面如何书写动态SQL,以及完成级联查询的关键。
164 6
|
10天前
|
SQL 关系型数据库 MySQL
【MySQL-4】简述SQLの通用语法及4种基本语句介绍(DDL/DML/DQL/DCL)
【MySQL-4】简述SQLの通用语法及4种基本语句介绍(DDL/DML/DQL/DCL)
|
10天前
|
SQL 存储 关系型数据库
【MySQL系列笔记】SQL优化
SQL优化是通过调整数据库查询、索引、表结构和配置参数等方式,提高SQL查询性能和效率的过程。它旨在减少查询执行时间、减少系统资源消耗,从而提升数据库系统整体性能。优化方法包括索引优化、查询重写、表分区、适当选择和调整数据库引擎等。
189 3
|
11天前
|
SQL 关系型数据库 MySQL
MySQL SQL error: #1271 - Illegal mix of collations for operation ‘UNION‘
MySQL SQL error: #1271 - Illegal mix of collations for operation ‘UNION‘
|
12天前
|
SQL 关系型数据库 MySQL
【MySQL】:探秘主流关系型数据库管理系统及SQL语言
【MySQL】:探秘主流关系型数据库管理系统及SQL语言
25 0
|
15天前
|
SQL 关系型数据库 MySQL
【MySQL】SQL优化
【MySQL】SQL优化
|
16天前
|
SQL 存储 关系型数据库
MySQL SQL优化
MySQL SQL优化
16 0
|
18天前
|
SQL 关系型数据库 MySQL
快速学习MySQL SQL语句
快速学习MySQL SQL语句
|
23天前
|
SQL Oracle 关系型数据库
常用数据库的分页语句(mySQL、oracle、PostgreSQL、SQL Server)
常用数据库的分页语句(mySQL、oracle、PostgreSQL、SQL Server)
|
25天前
|
SQL NoSQL 关系型数据库
【后端面经】【数据库与MySQL】SQL优化:如何发现SQL中的问题?-02
【4月更文挑战第13天】该文介绍了几个数据库查询优化技巧。首先,创建覆盖索引如<A,B,C>能加速`select A,B,C from student where A=? and B=? and C=?`的执行。其次,为常用于排序的列建立索引,如在`id,update_time`上建索引,可避免数据排序,显著提高查询速度。优化`count(*)`可通过预估值或使用Redis记录总数,但需注意数据一致性问题。使用索引提示如FORCE INDEX可强制使用特定索引,但应谨慎。将`having`的非聚合条件移到`where`里可提升效率。最后,处理深度分页时
23 3