正文
首先,日志的作用基本上就是记录一些用户的行为,让用户的操作可以进行追溯、可查看的效果。同理Mysql的日志也是起到了这个作用,不过在此的基础上,又增加了其他的新功能,比如利用日志信息完成一些事务的操作。介绍来介绍一下Mysql的日志的作用。
事务ACID的实现
我们先来介绍一下事务ACID的实现:
原子性:通过undo log实现
一致性:通过undo log和redo log共同实现
隔离性:通过锁机制和undo log实现
持久性:redo log实现
可以看到事务的ACID是通过redo log 和 undo log来实现的,下面我们首先介绍下这两种日志
Mysql日志类型
逻辑日志(存储了逻辑SQL修改语句)
物理日志(存储了数据被修改的值)
Redo Log(重做日志)
我们知道innoDB有个特性是缓冲池,缓冲池中的脏页(该page和磁盘数据不一致)数据会定期刷新到磁盘上。但是如果数据库宕机,并且插入缓冲中的数据还没有来得及刷新到磁盘上,这些内存中的脏页数据就会丢失,从而导致无法保证持久性。由此,mysql 引入了redo log来解决这个问题。这是redo log写入的流程是:
对数据进行修改时,先写入redo log,然后再更新到插入缓冲,保证数据不会因为宕机而丢失,保证持久性
当事务提交的时候会将redo log刷至磁盘持久化。
因为缓冲池每次刷脏页到磁盘是随机IO每次修改的数据是不确定的,且是以页为单位进行的,每次都要整页写入,所以整体速度比较慢,而redo log 是在页中追加,顺序IO并且每次都值写入修改的部分,IO量降低很多,速度较快
redo log由两部分组成:
redo log buffer
redo log file
InnoDB保证持久性的机制是 force log at commit:当事务commit时,先将事务的所有redo log buffer写入到redo log file进行持久化,才能commit成功。这就保证了整个事务的持久性。其中为了确保log buffer能写入到log file,每次都是通过fsync操作来去持久化的。
Undo Log
undo log主要被用于到实现事务的原子性和隔离性undo log属于逻辑日志
作用
保存了事务发生之前的数据版本,用于回滚(原子性)
提供了并发控制(MVCC)(隔离性)
undo log和redo log正好相反,undo log记录的是数据发生修改之前的信息,并且记录的是逻辑变化,比如要执行一个delete操作,那么undo log记录的就是一个insert操作,执行一个update操作,那么undo log记录的是一个反向的update操作。
隔离性原理
隔离性也就是事务内的查询不会查询到其他事务的修改,也就是事务之间互相隔离。
undo log被innoDB引擎用于了多版本并发控制。
innoDB通过undo log保存了已更改的行数据的旧版本的数据快照,这样undo log中的数据可以作为旧版本数据快照供其他事务读取,来达到一个隔离性的目的。
Binlog
binlog是Mysql Server层维护的一个二进制日志,和binlog不一样的是redo log和undo log都是innoDB引擎层面的实现。使用场景
主从复制:Mysql Replication在master端开启binlog,然后slave通过拉取复制master的binlog日志到salve,来完成主从同步复制。
数据恢复:生成binlog文件之后,我们可以通过mysqlbinlog工具恢复数据。
binlog的3种日志格式
ROW 格式
ROW格式记录的是每一行实际的数据变更,然后savle再将相同的数据进行修改来达到一致性。优点:binlog不需要记录上下文信息,只需要保存对应的行的数据修改即可。所以这种模式下会记录数据的修改细节,不会受到系统函数变量或者存储过程的影响导致无法正确复制的问题缺点:因为会记录下所有的数据变更,所以当修改量大的时候产生的日志比较大。
STATEMENT 格式
STATEMENT格式会记录每一行数据修改的sql,然后salve通过执行sql来同步数据。优点:首先是解决了ROW格式的缺点,不需要记录每一行的数据变化,只需要记录sql语句和上下文信息即可,减少了binlog日志的量。缺点:因为只记录了sql语句,当sql中使用了某些特定的函数:比如当前时间和随机数的时候,在salve再次执行的时候很大可能会造成主从不一致的问题。
MIXED 格式
Mixed格式下,Mysql会根据具体执行的每一条sql来区分对待记录的日志格式,在Statement和Row之间选择一种合适的格式。如果sql语句就是简单的insert或者update就会记录具体的行变更。
上面简单的介绍了Mysql的一些基本的日志的,每一种日志都会有不同的作用,同时数据库的隔离级别以及它的ACID的特性都是用一些日志加上它自己的锁机制来实现的。到这里基本上一个简单的介绍的过程就结束了,谢谢大家的阅读。