MySQL 可以分为 Server 层和存储引擎层两部分。
- Server 层:连接器、查询缓存、分析器、优化器、执行器等,所有跨存储引擎的功能都在这一层实现,比如存储过程、触发器、视图等。
- 存储引擎层:插件式的架构,支持 InnoDB、MyISAM、Memory 等多个存储引擎,负责数据的存储和提取
连接器
负责跟客户端建立连接、获取权限、维持和管理连接。
步骤
- TCP三次握手建立连接
- 连接器开始认证身份
成功建立连接后对这个用户的权限做修改,不会影响已经存在连接的权限,只有再新建的连接才会使用新的权限设置。
查看连接
show processlist 命令中可以看到空闲连接,客户端如果太长时间没动静,连接器就会自动将它断开。这个时间是由参数 wait_timeout(默认8 小时)控制。
长连接和短连接
- 长连接是连接成功后,如果客户端持续有请求,则一直使用同一个连接。
- 短连接是指每次执行完很少的几次查询就断开连接,下次查询重新建立。
长连接问题
某些情况下MySQL使用长连接会造成MySQL 占用内存涨得特别快,因为执行过程中临时使用的内存是管理在连接对象里面的。优化如下
- 代码层判断执行过一个大查询后,断开重新连接
- 5.7版本之后,mysql_reset_connection 来重新初始化连接资源,不需要重连和权限校验,但是会将连接恢复到刚创建的状态。
查询缓存
之前执行过的语句及其结果可能会以 key-value 对的形式,被直接缓存在内存中,命中则直接返回结果。
只要有对一个表的更新,这个表上所有的查询缓存都会被清空,所以大多数情况下往往利大于弊
分析器
- 词法分析:字符串分别是什么,代表什么
- 语法分析:语法分析器会根据语法规则,判断你输入的这个 SQL 语句是否满足 MySQL 语法。
优化器
- 在表里面有多个索引的时候,决定使用哪个索引;
- 在一个语句有多表关联(join)的时候,决定各个表的连接顺序。
优化器阶段完成后,这个语句的执行方案就确定下来了,然后进入执行器阶段
执行器
执行步骤
- 先判断一下你对这个表 T 有没有执行查询的权限
- 会根据表的引擎定义,去使用这个引擎提供的接口
执行器流程
- 调用 InnoDB 引擎接口取这个表的第一行,判断 ID 值是不是 10,如果不是则跳过,如果是则将这行存在结果集中;
- 调用引擎接口取“下一行”,重复相同的判断逻辑,直到取到这个表的最后一行。
- 执行器将上述遍历过程中所有满足条件的行组成的记录集作为结果集返回给客户端。
数据库慢查询日志中rows_examined 字段,表示执行过程中扫描了多少行,是在执行器每次调用引擎获取数据行的时候累加的。
有些场景下,执行器调用一次,在引擎内部则扫描了多行,因此引擎扫描行数和rows_examined 并不是完全相同的。