一生挚友redo log、binlog《死磕MySQL系列二》（2）

2022-05-20 223

版权

本文内容由阿里云实名注册用户自发贡献，版权归原作者所有，阿里云开发者社区不拥有其著作权，亦不承担相应法律责任。具体规则请查看《阿里云开发者社区用户服务协议》和《阿里云开发者社区知识产权保护指引》。如果您发现本社区中有涉嫌抄袭的内容，填写侵权投诉表单进行举报，一经查实，本社区将立刻删除涉嫌侵权内容。

本文涉及的产品

RDS MySQL DuckDB 分析主实例，集群系列 4核8GB

RDS MySQL DuckDB 分析主实例，基础系列 4核8GB

RDS Agent（兼容OpenClaw），2核4GB

简介： 一生挚友redo log、binlog《死磕MySQL系列二》

二、binlog

您可以从总体上了解到 MySQL架构分为两层，一个是 server层，另一个是存储引擎层。

server层当然是负责功能方面的，而存储引擎层则负责处理与存储相关的操作。

而且上面提到的redo log是Innodb存储引擎层特有的，其它存储引擎是不具备的，而server层也有自己的日志记录，就是将要聊到的binlog。

redo log和binlog的区别

redo log是Innodb引擎特有的，而binlog是MySQLserver层特有的，所有引擎都可以使用。

redo log是物理日志，它记录的是一条更新操作所做的修改，binlog是逻辑日志，记录的是一条更新语句执行逻辑

redo log是循环写的，并且空间是固定的，比如上面配置4个1GB的redo log文件，binlog是追加写的，这个文件写完了，换下一个文件，不会覆盖以前的日志。这也就是你经常看到只要你有完整的binlog文件就可以给你恢复到你想要的数据。

MySQL为什么会有俩份日志呢？

在没有Innodb存储引擎之前，MySQL默认存储引擎是MyIsam，但MyIsam是没有重启恢复能力的，binlog日志也仅用于归档。

Innodb是另一家公司以插件的形式引入到Mysql，既然binlog没有重启恢复的能力，那么我就使用redo log来实现重启恢复的功能。

这就导致了当你使用Innodb存储引擎时会写俩份日志。

三、什么是两阶段提交

对redo log、binlog有了一定的认识后再来看看一条更新语句的执行流程。

update user set age = age + 1 where id = 1;

执行器先到引擎层找到id = 1这一行，由于ID是主键，所以会在主键索引树找到这一行。如果ID=2这一行所在的数据页本来就在内存中，就直接返回给执行器。否则，需要先从磁盘中读入内存，然后再返回。

执行器拿到存储引擎返回id = 2结果后，给age加上1，原来是25，现在就是26,在调用引擎接口写入这行新数据。

引擎将这行数据先更新到内存中，同时将这个更新操作记录到redo log中，此时redo log处于prepare状态。然后告知执行器执行完成了，随时可以提交事务。

接着执行器生成这个操作的binlog，并把binlog写入磁盘。

执行器调用引擎的提交事务接口，引擎把刚刚写入的redo log改成提交commit状态，更新完成。

到这里你应该就清晰了，一条更新SQL会先写redo log再写binlog，这也就是标题为什么叫一生挚友redo log、binlog。

四、为什么需要两阶段提交

是为了让redo log跟binlog两份日志之间的逻辑一致，看下面俩种情况。

先写redo log后写binlog

更新语句为age = age +1

将数据写入redo log，MySQL进程异常重启

此时binlog还没有开始写
系统重启后进行数据恢复此时的值为26
需要搭建从库时需要拿binlog进行恢复数据，但此时age = age +1 这行的操作是没有记录到binlog的
那么此时的从库就会少这一次的更新，恢复出来的age依然是25，造成于主库数据不一致。

先写binlog后写redo log

更新语句为age = age +1
将数据写入binlog，MySQL异常重启
此时redo log 还没写
MySQL系统重启，这个更新操作是对于redo log是不存在的，所以重启后的值依然是25
但binlog 中的值已将是26了
需要搭建从库时，从库的值是26，主库的值是25，造成主从数据不一致

所以说，如果不使用两阶段提交，那么原库和用它的binlog日志恢复出来的库数据是不一致的。

五、《孔乙己》让你明白redo log是什么

来看一个初中九年级语文课文中《孔乙己》这篇文章，就算不记得内容，标题总记得哈！

这个案例也是看丁老师文章中提到的，为什么丁老可以灵活的使用这个案例来讲redo log而我们想不到呢？

其本质原因是对知识点没有理解透彻，使用生活案例来解释技术是让人最容易理解并不难遗忘的。

《孔乙己》中的主人公就叫他酒店掌柜，掌柜的有俩件法宝让比其他老板工作效率高很多。一个是小黑板另一个是账本。

试想一下如果有客人要赊账，是直接写到黑板效率高，还是翻密密麻麻的账本来的快呢？

掌柜肯定会选择先记录到黑板上，等人少或者不忙时再把黑板的记录写到账本中。

反之老板没有黑板的话，只能在密密麻麻的账本中先找到赊账人的名字，如果之前有赊账记录追加，找了一遍发现没有才进行新增。

这个过程不仅繁琐而且效率低的让人难以接受，如果酒店客人多老板是记录不过来的。

同样，在MySQL中也会存在这个问题，每次执行更新语句都需要先找到那条记录，然后再更新，整个过程IO成本、查找成本都很高。所以MySQL也利用了酒店掌柜的智慧使用黑板来提升执行效率。

画一幅图让大家能更好的理解掌柜、黑板、在MySQL中的对应关系。

六、redo log参数详解

事务的持久性就是通过重做日志来实现的。

当提交事务之后，并不是直接修改数据库的数据的，而是先保证将相关的操作记录到redo日志中。

数据库会根据相应的机制将内存的中的脏页数据刷新到磁盘中。

上图是一个简单的重做日志写入流程。

在上图中提到俩个陌生概念，Buffer pool、redo log buffer，这个俩个都是Innodb存储引擎的内存区域的一部分。

而redo log file是位于磁盘位置。

也就说当有DML（insert、update、delete）操作时，数据会先写入Buffer pool，然后在写到重做日志缓冲区。

重做日志缓冲区会根据刷盘机制来进行写入重做日志中。

这个机制的设置参数为innodb_flush_log_at_trx_commit，参数分别为0,1，2

上图即为重做日志的写入策略。

当这个参数的值为0的时，提交事务之后，会把数据存放到redo log buffer中，然后每秒将数据写进磁盘文件

当这个参数的值为1的时，提交事务之后，就必须把redo log buffer从内存刷入到磁盘文件里去，只要事务提交成功，那么redo log就必然在磁盘里了。

当这个参数的值为2的情况，提交事务之后，把redo log buffer日志写入磁盘文件对应的os cache缓存里去，而不是直接进入磁盘文件，1秒后才会把os cache里的数据写入到磁盘文件里去。

服务器异常停止对事务如何应对（事务写入过程）

当参数为0时，前一秒的日志都保存在日志缓冲区，也就是内存上，如果机器宕掉，可能丢失1秒的事务数据。

当参数为1时，数据库对IO的要求就非常高了，如果底层的硬件提供的IOPS比较差，那么MySQL数据库的并发很快就会由于硬件IO的问题而无法提升。

当参数为2时，数据是直接写进了os cache缓存，这部分属于操作系统部分，如果操作系统部分损坏或者断电的情况会丢失1秒内的事务数据，这种策略相对于第一种就安全了很多，并且对IO要求也没有那么高。

小结

关于性能：0>2>1

关于安全：1>2>0

根据以上结论，所以说在MySQL数据库中，刷盘策略默认值为1，保证事务提交之后，数据绝对不会丢失。

一生挚友redo log、binlog《死磕MySQL系列二》（2）

二、binlog

三、什么是两阶段提交

四、为什么需要两阶段提交

五、《孔乙己》让你明白redo log是什么

六、redo log参数详解

热门文章

最新文章

相关课程

相关电子书

推荐镜像

探索云世界

热门

云计算

大数据

云原生

人工智能

数据库

开发与运维

活动广场

任务中心

训练营

直播

乘风者计划

下载

镜像站

技术资料

一生挚友redo log、binlog《死磕MySQL系列 二》（2）

二、binlog

三、什么是两阶段提交

四、为什么需要两阶段提交

五、《孔乙己》让你明白redo log是什么

六、redo log参数详解

热门文章

最新文章

相关课程

相关电子书

推荐镜像

一生挚友redo log、binlog《死磕MySQL系列二》（2）