一、从宏观的角度分析MySQL
首先看一张经典图片
这幅图估计很多人都看到过,也是经典之作高性能MySQL里边的,如果有兴趣可以先看一下电子版的(如需要电子版可联系咔咔),感觉自己能看进去了,再去买书也来的急。
闲话少说,进入正题。
上图的客户端可以直接理解为PHP、Java等。接下来,你会看到连接、线程处理。这一部分并不是MySQL所特有的,而且大多数客户端、服务器都具有类似的结构。
因此,一般而言,MySQL可以分为两层:Server层和存储引擎层。
Server层主要包括连接层、查询缓存、分析器、优化器、执行器等重要模块组成,这一层还包含了MySQL核心Api部分,比如常用的格式化时间、加密等。
存储引擎大家都很熟悉,因为在面试中不止一次的问过大家Innodb、Myisam存储引擎的不同。
所以想过没有,MySQL为什么会有这么多的存储引擎呢?
一切技术起源于当下问题,同样在MySQL中也不例外。
MySQL在存储引擎这一方面的架构是插件式的,即可以随意切换不固定,而且MySQL5.5版本存储引擎已经默认为Innodb。
二、一条SQL执行要经过多少困难?
下图是咔咔之前培训时给发的资料
图中还有一个熟悉的陌生人查询缓存模块,该模块在MySQL8.0中已不存在。
关于该模块为何要被删除,后续的文章也将于大家交流。
首先,我们将大致了解当我们执行一条SQL语句时,如何在这个架构图中运行。
2-1 连接器
mysql -u root -p连接数据库命令,在执行之后,你将需要输入密码。当完成经典的TCP握手之后,连接器就开始发挥作用了。
如果码错误时,则返回Access denied for user ‘root‘@‘localhost‘ (using password: YES,错误编码1045。
如果连接信息均正确,则此时将根据你输入的用户访问权限表来获取该用户的权限,此处必须清楚,当你登录成功后,即使其他人修改了你的权限,在这个连接未断开之前你的权限是不会发生改变的。
当你连接完成之后,如果你一直不做任何事情,执行show processlist将会看到一个sleep,表示空连接。
那么你知道在MySQL中,如果连接成功后没有进行任何操作,多久会被自动中断?
可以执行show variables like 'wait_timeout';用于查看时间。
在MySQL中如果没有特别说明,那么所有的时间都是以秒为单位的,根据时间转换可以得知空连接持续8小时。
2-2 查询缓存
你需要注意的是,MySQL8.0已经被取消了,这个问题不止说了一次了,特别是那些正在使用MySQL8.0以下版本的小伙伴要注意哈!当你切换到8.0时候,遇到这个问题不知道怎么解决。
MySQL8.0为何取消查询缓存模块
这个模块的设计,把查询语句作为key ,将结果作为value 进行缓存,一旦这个表有更新,之前所有的缓存都会被清除掉。这就像你辛辛苦苦写的代码提交之后被别人覆盖一样难受。
MySQL8.0以下的版本提供了一个参数query_cache_type = enmand来控制是否要使用查询缓存,在设置完成后,默认的select语句将不会被缓存。
如果确实可以使用部分场景,那么你可以将sql_cache添加到select关键字之后。
如果一条select语句之前被缓存过,那么结果集在这里就会直接返回,而没有缓存过的select语句就比较辛苦了,还要继续自己的漫漫长路。
2-3 分析器
MySQL8.0之前,它会在进入分析器之前判断是否缓存,在MySQL8.0之后,连接器验证成功后就直接进入分析器。
分析器,根据字面意思来理解就是分析要执行的SQL语句是什么,要做什么。
比如执行select * from user where id = 1
MySQL首先根据select判断这是一个查询语句,然后将user识别为表名,id识别为字段名,这个过程被称为词法分析。
下一步,需要知道该SQL的语法是否正确,进行语法分析,如果语法不对你就会看到You have an error in your SQL syntax错误。通常,将在use near中找到该错误。
2-4 优化器
到了这一步,MySQL知道你要做什么,但是要选择最佳执行方案。
优化器都优化些什么?
举例来说:多个索引时选择那个索引、多表关联时连接顺序。
现在你是否想知道,优化器将优化多表关联的连接顺序,那在写SQL语句时是否就不必考虑连接顺序呢?
当然不是,能让MySQL少做事情就少做,还是一个准则用小表驱动大表。
2-5 执行器
通过要做什么、怎么做后这条SQL语句才会真正的被执行,先进行权限验证,若没有权限则直接返回权限错误,否则根据表定义的存储引擎,去使用对应引擎提供的接口。
三、总结
上图包含了正文的所有知识点,也是整个MySQL的大体执行流程图,后期文章都将围绕这几个要点展开。