企业运维训练营之数据库原理与实践—云数据库备份与恢复—数据库备份恢复原理（上）-阿里云开发者社区

企业运维训练营之数据库原理与实践—云数据库备份与恢复—数据库备份恢复原理（上）

2023-05-23 463

版权

本文内容由阿里云实名注册用户自发贡献，版权归原作者所有，阿里云开发者社区不拥有其著作权，亦不承担相应法律责任。具体规则请查看《阿里云开发者社区用户服务协议》和《阿里云开发者社区知识产权保护指引》。如果您发现本社区中有涉嫌抄袭的内容，填写侵权投诉表单进行举报，一经查实，本社区将立刻删除涉嫌侵权内容。

本文涉及的产品

RDS AI 助手，专业版

RDS MySQL DuckDB 分析主实例，集群系列 4核8GB

RDS MySQL DuckDB 分析主实例，基础系列 4核8GB

简介： 企业运维训练营之数据库原理与实践—云数据库备份与恢复—数据库备份恢复原理（上）

二、数据库备份恢复原理

进行逻辑备份时会涉及很多库表，比如备份a表时花费10秒钟，而开始备份b表时已经是10秒钟以后的数据，会导致数据不一致。此类问题如何解决？

MySQL能够通过事务与各种日志保证数据一致性。

MySQL的主流引擎是InnoDB，是一个事务型引擎。事务的4个特性为原子性、一致性、隔离性与持久性，以上四个特性能够完整描述出事务的样子。事务有两个状态，分别为成功或失败，失败后可以回滚。事务与事务之间互相隔离，不同的隔离级别看到的数据会略有不同。事务提交后，不管发生宕机或其他事件，数据都需要能够保存在磁盘上。而一致性主要通过其他三种特性共同保证。

事务4个特性的实现主要依靠3个日志文件：

• Redo log：记录数据更新后的值。保证能够落盘，因此可以用来恢复未写入data file的已成功事务更新的数据。原先的存储大多使用随机IO，而Redo log使用顺序IO，速度可以得到大幅提升。同时，原先的存储数据分布非常零散，更新几个列值需要多次IO，而顺序IO的场景下能够大幅减少IO次数。综上，Redo log的目的主要有保证数据的持久性以及提升速度。

• Undo log：记录数据被更新前的镜像值，保证数据能够回滚。主要用于事务多版本并发控制以及原子性。

• Binlog：Binlog存在于 server 层，会记录所有提交的DML与DDL，用于做主从复制、数据恢复或同步。为了保证binlog数据的一致性，MySQL采用2阶段提交。

以下举例说明Redo与Undo之间的关系。假设a、b两个数据值都为500，a减100、b加100的事务行为如下：

首先，事务开始，记录a=500到Undo log。修改为a=400，并记录到Redo log。事务的写流程都为先写Undo log再写Redo log，因此后续流程为记录b=500到Undo log，记录b=600到Redo log，最终事务提交。LSN是日志序列号，用于记录数据库里面数据的一致性位置，主要存在于data buffer和redo buffer。

事务提交之后即落盘，但是在如果在提交过程中发生了crash，数据库会做recover，先前滚，再回滚，流程如下：

确定恢复起点checkpoint_LSN，然后对比LSN号，应用redo log中最新的日志文件数据，达到crash前一刻状态。最后对prepare状态事务进行回滚，数据状态恢复正常。这也是两阶段事务提交的具体逻辑。

上图右侧为MySQL内存与磁盘的结构。