MySQL Binlog(主从同步/数据恢复) 及 mysqldump:

本文涉及的产品
RDS MySQL Serverless 基础系列,0.5-2RCU 50GB
云数据库 RDS MySQL,集群系列 2核4GB
推荐场景:
搭建个人博客
云数据库 RDS PostgreSQL,集群系列 2核4GB
简介: MySQL Binlog(主从同步/数据恢复) 及 mysqldump:

 MySQL 的二进制日志 binlog 可以说是 MySQL 最重要的日志,它记录了所有的 DDL 和 DML 语句(除了数据查询语句select、show等),以事件形式记录,还包含语句所执行消耗的时间,MySQL的二进制日志是事务安全型的。binlog 的主要目的是主从复制和数据恢复

Binlog日志的两个重要的使用场景:

    1. MySQL主从复制:MySQL Replication在Master端开启binlog,master把它的二进制日志传递给slaves来达到master-slave数据一致的目的
      image.gif编辑

    image.gif编辑

    根据这张图,把 mysql 的主备复制原理分解为如下流程:

      • 总结来说,MySQL 的主从复制:异步单线程
      • Master上 1 个IO线程,负责向Slave传输 binary logbinlog
      • Slave上 2 个线程:IO 线程执行SQL的线程,其中:
        • IO线程:将获取的日志信息,追加到relay log上;
        • 执行SQL的线程:检测到relay log中内容有更新,则在Slave上执行sql;

          特别说明:MySQL 5.6.3 开始支持「多线程主从复制」,一个数据库一个线程多个数据库多个线程    

          MySQL 主从复制 / 增量同步(个人总结):

            1. master要开启binlog,并记录所有修改db数据的事件
            2. slave会启动一个io线程,与master建立客户单连接
            3. master也启动一个io线程(二进制转储线程)去读取master上的binlog日志,并向slave上的io线程发送"二进制数据"
            4. slave接收到"二进制数据"并保存在relay log中
            5. slave另启动sql线程,负责更新relay log中的数据到从库中(执行一遍relay log中的增量数据修改操作)

            具体建立从库的方法参考:MySQL增加从库 - Jadear - 博客园

            2. 数据恢复:通过使用 mysqlbinlog 工具来使恢复数据

            mysql binlog有三种格式:

              • statement(默认):基于SQL语句的复制(statement-based replication, SBR)
              • row(常用):基于行的复制(row-based replication, RBR)
              • mixed(前两者混合使用):混合模式复制(mixed-based replication, MBR)

              statement 优点:生成的日志文件体积小,节约IO,存储的是sql执行语句

              statement 缺点:搭建MySQL主从时,会出现一些问题:比如master查询当前时间select now(),slave同步master的binlog后,同样查询当前时间,这时候就会出现主从二者时间不一致的问题。

              row 优点:记录以行为结果的修改记录,确保主从数据的一致。

              row 缺点:由于是以每行记录的修改来写日志,故日志体积大(正常日志的3-5倍大小),占用大量 “io/网络” 资源(可能造成主从同步的延迟)。另外,mysql主从是异步的,倘若master突然挂了,那么有可能会导致slave数据的缺失,主从的数据不一致。

                     补充:

                • 使用 show variables like '%binlog_format%'; 查看使用的格式      
                • 将二进制日志格式设置为ROW时,有些更改仍然使用基于语句的格式,包括所有DDL语句,例如:CREATE TABLE ALTER TABLE,或 DROP TABLE

                启用Binlog:

                启用Binlog,通过配置/etc/my.cnf /etc/mysql/mysql.conf.d/mysqld.cnf配置文件的 log-bin 选项:

                在配置文件中加入 log-bin 配置,表示启用binlog,如果没有给定值,写成 log-bin=,则默认名称为主机名。(注:名称若带有小数点,则只取第一个小数点前的部分作为名称)

                [mysqld]
                log-bin=my-binlog-name

                image.gif

                也可以通过 SET SQL_LOG_BIN=1 命令来启用 binlog,通过 SET SQL_LOG_BIN=0 命令停用 binlog。启用 binlog 之后须重启MySQL才能生效。

                 

                常用Binlog操作命令:

                # 是否启用binlog日志
                show variables like 'log_bin';
                # 查看详细的日志配置信息
                show global variables like '%log%';
                # 查看所有二进制日志列表
                show master logs; 或 show binary logs;
                # 查看最新一个binlog日志文件名称和Position
                show master status;
                # 修改binlog的格式
                set global binlog_format='mixed' 
                # 查看 binlog 内容
                show binlog events;
                # 查看具体一个binlog文件的内容 (in 后面为binlog的文件名)
                show binlog events in 'master.000003';
                # 设置binlog文件保存时间,过期自动删除,单位: 天
                set global expire_log_days=3; 
                ...

                image.gif

                写 Binlog 的时机:

                对支持事务的引擎如InnoDB而言,必须要提交了事务才会记录binlog。binlog 什么时候刷新到磁盘跟参数 sync_binlog 相关。

                  • 如果设置为0,则表示MySQL不控制binlog的刷新,由文件系统去控制它缓存的刷新;
                  • 如果设置为不为0的值,则表示每 sync_binlog 次事务,MySQL调用文件系统的刷新操作刷新binlog到磁盘中。
                  • 设为1是最安全的,在系统故障时最多丢失一个事务的更新,但是会对性能有所影响。

                  如果 sync_binlog=0sync_binlog大于1,当发生电源故障或操作系统崩溃时,可能有一部分已提交但其binlog未被同步到磁盘的事务会被丢失,恢复程序将无法恢复这部分事务。

                  注:在MySQL 5.7.7之前,默认值 sync_binlog 是0,MySQL 5.7.7和更高版本使用默认值1,这是最安全的选择。一般情况下会设置为100或者0,牺牲一定的一致性来获取更好的性能。

                  生成binlog日志文件(xxx.0000*)的触发条件:

                  当遇到以下3种情况时,MySQL会重新生成一个新的日志文件,文件序号递增:

                    • MySQL服务器停止或重启时
                    • 使用 flush logs 命令;
                    • 当 binlog 文件大小超过 max_binlog_size(最大1G) 变量的阈值时;

                    mysqlbinlog 命令的使用:

                    服务器以二进制格式将binlog日志写入binlog文件,如果要以文本格式显示其内容,可以使用 mysqlbinlog 命令。(--base64-output=decode-rows 命令用于对二进制binlog的解码)

                    # mysqlbinlog 的执行格式
                    mysqlbinlog [options] log_file ...
                    # 查看bin-log二进制文件(shell方式),二进制格式需要用 --base64-output=decode-rows 解码
                    mysqlbinlog -v --base64-output=decode-rows /var/lib/mysql/master.000003
                    # 查看bin-log二进制文件(带查询条件)
                    mysqlbinlog -v --base64-output=decode-rows /var/lib/mysql/master.000003 \
                        --start-datetime="2019-03-01 00:00:00"  \
                        --stop-datetime="2019-03-10 00:00:00"   \
                        --start-position="5000"    \
                        --stop-position="20000"

                    image.gif

                    设置日志格式为ROW时,输出信息示例:

                    # at 21019
                    #190308 10:10:09 server id 1  end_log_pos 21094 CRC32 0x7a405abc  Query thread_id=113 exec_time=0 error_code=0
                    SET TIMESTAMP=1552011009/*!*/;
                    BEGIN
                    /*!*/;

                    image.gif

                    上面输出信息包括:

                      • position: 位于文件中的位置,即第一行的(# at 21019),说明该事件记录从文件第21019个字节开始
                      • timestamp: 事件发生的时间戳,即第二行的(#190308 10:10:09)
                      • server id: 服务器标识(1)
                      • end_log_pos 表示下一个事件开始的位置(即当前事件的结束位置+1)
                      • thread_id: 执行该事件的线程id (thread_id=113)
                      • exec_time: 事件执行的花费时间
                      • error_code: 错误码,0意味着没有发生错误
                      • type:事件类型Query

                      如何定位用于恢复时的position:

                      参考文章:

                      mysql的数据备份和还原 - 如何使用mysqldump和mysqlbinlog(简单流程)

                      mysqldump全量备份+mysqlbinlog二进制日志增量备份(★★★★★ 详细流程:包含导入节点后的增量数据恢复操作)

                      既然了解到binlog在数据恢复下的使用场景,那么如何确定恢复数据的起止位置呢?两种方式:

                      (1) 可以按照 起止时间点 来恢复数据:mysqlbinlog  --start-date=... --stop-date=...

                      mysqlbinlog  --start-date="2015-09-09 15:23:40" --stop-date="2015-09-09 15:24:11" mysql-bin.000003 | mysql -uroot -pro

                      (2) 也可以按照 position 来恢复数据...如下:

                      image.gif编辑

                      具体示例:

                      参考:mysql idb恢复删除之前的数据_恢复MySQL数据到误删的表之前的数据

                      (1)可通过 grep定位drop 表语句所在binglog文件的位置点来做恢复:

                      执行命令:

                      mysqlbinlog -v --base64-output=decode-rows /data/mysql/mysql3306/binlog/mysql-bin.000005 | grep -i -C 15 drop

                      参数选项:

                        • --base64-output=decode-rows 命令用于二进制日志文件的解码
                        • -i:搜索时忽略大小写
                        • -C:匹配行和它前后各n行。

                        ### @1=10422

                        ### @2='tomcat'

                        ### @3='xiaohuahua'

                        ### @4='2019-08-08 14:22:18'

                        # at 14987

                        #190808 14:22:18 server id 63306 end_log_pos 15018 CRC32 0x873943dd Xid = 20695

                        COMMIT/*!*/;

                        #at15018###################################

                        #190808 14:22:19 server id 63306 end_log_pos 15083 CRC32 0xcc8773ce GTID last_committed=34 sequence_number=35 rbr_only=no

                        SET @@SESSION.GTID_NEXT= 'bde7b592-b966-11e9-8c64-000c294f3e61:10445'/*!*/;

                        #at 15083

                        #190808 14:22:19 server id 63306 end_log_pos 15211 CRC32 0x8d445019 Query thread_id=7213 exec_time=0 error_code=0

                        use `testdb`/*!*/;

                        SET TIMESTAMP=1565245339/*!*/;

                        SET @@session.sql_auto_is_null=0/*!*/;

                        DROPTABLE `test1_event` /* generated by server */

                        /*!*/;

                        SET @@SESSION.GTID_NEXT= 'AUTOMATIC' /* added by mysqlbinlog */ /*!*/;

                        DELIMITER ;

                        #End of log file

                        /*!50003 SET COMPLETION_TYPE=@OLD_COMPLETION_TYPE*/;

                        /*!50530 SET @@SESSION.PSEUDO_SLAVE_MODE=0*/;

                        注意:这里的恢复数据的position或date只能是插入或修改的记录块。如果选择删除的记录块,则数据恢复不了。其原理跟普通的sql语句一样,日志只是把操作以sql语句的形式存储起来,恢复数据的时候执行一遍sql语句,而达到恢复数据的效果。因为只有insert 和 update 才会有数据存储。

                        binlog在 MySQL主从复制 中的应用原理:

                        image.gif编辑

                        对于数据库操作,应该注意如下问题:

                        1、要常备份(全备,增量备份),出了问题可以最快恢复数据;

                        2、操作数据库前,要把需要操作的数据库或者表dump出来;

                        3、需要把bin-log打开,就算没有做上面的两步,也可以通过日志恢复数据

                        补充:

                        1. 关于MySQL事务什么时候会触发写binlog的操作?

                        对支持事务的引擎如InnoDB而言,必须要提交了事务才会记录日志到binlog

                         

                        2. mysqldump和mysqlbinlog 二者区别:

                        首先理解两个概念:

                          • 全量备份:每次备份都备份当前系统中的所有数据。
                          • 增量备份:备份当前时间点的数据与上次备份时间点数据的差异。

                          (1)mysqlbinlog 可以自动备份,mysqldump  是需要手动备份导出的;

                          (2)mysqlbinlog二进制日志常用于增量备份,mysqldump常用于全量备份;

                          策略:MySQL 备份一般采取全库备份加日志备份的方式,例如每天执行一次全备份,每小时执行一次二进制日志增量备份。这样在 MySQL 故障后可以使用全备份和日志备份将数据恢复到最后一个二进制日志备份前的任意位置或时间。

                          3. 什么场景下要关闭mysql binlog?

                          比如大批量导入数据的时候,没有必要去记录其binlog,浪费性能和空间,这时候可以短暂关掉。

                          4. 关于主从复制:

                          mysql 5.6之前是串行复制,5.6之后是并行复制。

                          5. 关于mysqldump的命令选项:--master-data=1

                          参考:Mysql使用mysqldump和mysqlbinlog进行备份

                          image.gif编辑

                          mysqldump会导致锁表,innodb需加上 --single-transaction 选项:

                          背景:

                                 在使用mysqldump备份数据库的时候发现数据无法查询了,查询资料后得知:在执行mysqldump时会默认执行FLUSH TABLES WITH READ LOCK,这会关闭所有打开的表,同时对于所有数据库中的表都加一个读锁,直到显示地执行unlock tables,该操作常常用于数据备份的时候。

                          方法:

                                 所以如果你的表引擎是innodb的话,你不想在备份的时候因为全局读锁而导致数据查询失败,你可以加上 --single-transaction。


                          原理:

                                 在mysqldump中指定 single-transaction 时,会使用 "可重复读(REPEATABLE READ)" 事务隔离级别来保证整个dump过程中数据一致性,该选项仅对InnoDB表生效,且不能与ALTER TABLE/CREATE TABLE/DROP TABLE/RENAME TABLE/TRUNCATE TABLE等DDL操作并行。

                                 其中,可重复读保证在一个事务中所有相同的查询读取到同样的数据,也就大概保证了在dump期间,如果其他innodb引擎的线程修改了表的数据并提交,对该dump线程的数据并无影响,在这期间不会锁表


                          总结:

                                 如果不想阻塞同时表是innodb引擎可使用 single_transaction 取得一致性快照(取出的数据是导出开始时刻事务点的状态)

                          如果表不支持多版本特性,比如MyISAM,则只能使用 lock-all-tables 阻塞方式来保证一致性的导出数据。

                                 当然,如果能保证导出期间没有任何写操作,可不加或关闭 lock-all-tables

                          参考:mysqldump --master-data=2 --single-transaction_linuxheik的专栏-CSDN博客

                          更多可参考:

                          MySQL之mysqldump的使用

                          MySQL数据库备份与还原

                          MySQL mysqldump数据导出详解

                          MySQL主从复制的常见拓扑、原理分析以及如何提高效率(show processlist)

                          image.gif编辑



                          相关实践学习
                          如何快速连接云数据库RDS MySQL
                          本场景介绍如何通过阿里云数据管理服务DMS快速连接云数据库RDS MySQL,然后进行数据表的CRUD操作。
                          全面了解阿里云能为你做什么
                          阿里云在全球各地部署高效节能的绿色数据中心,利用清洁计算为万物互联的新世界提供源源不断的能源动力,目前开服的区域包括中国(华北、华东、华南、香港)、新加坡、美国(美东、美西)、欧洲、中东、澳大利亚、日本。目前阿里云的产品涵盖弹性计算、数据库、存储与CDN、分析与搜索、云通信、网络、管理与监控、应用服务、互联网中间件、移动服务、视频服务等。通过本课程,来了解阿里云能够为你的业务带来哪些帮助     相关的阿里云产品:云服务器ECS 云服务器 ECS(Elastic Compute Service)是一种弹性可伸缩的计算服务,助您降低 IT 成本,提升运维效率,使您更专注于核心业务创新。产品详情: https://www.aliyun.com/product/ecs
                          目录
                          相关文章
                          |
                          1月前
                          |
                          存储 SQL 关系型数据库
                          mysql 的ReLog和BinLog区别
                          MySQL中的重做日志和二进制日志是确保数据库稳定性和可靠性的关键组件。重做日志主要用于事务的持久性和原子性,通过记录数据页的物理修改信息来恢复未提交的事务;而二进制日志记录SQL语句的逻辑变化,支持数据复制、恢复和审计。两者在写入时机、存储方式及配置参数等方面存在显著差异。
                          |
                          29天前
                          |
                          监控 关系型数据库 MySQL
                          Flink CDC MySQL同步MySQL错误记录
                          在使用Flink CDC同步MySQL数据时,常见的错误包括连接错误、权限错误、表结构变化、数据类型不匹配、主键冲突和
                          96 16
                          |
                          28天前
                          |
                          SQL 关系型数据库 MySQL
                          数据库灾难应对:MySQL误删除数据的救赎之道,技巧get起来!之binlog
                          《数据库灾难应对:MySQL误删除数据的救赎之道,技巧get起来!之binlog》介绍了如何利用MySQL的二进制日志(Binlog)恢复误删除的数据。主要内容包括: 1. **启用二进制日志**:在`my.cnf`中配置`log-bin`并重启MySQL服务。 2. **查看二进制日志文件**:使用`SHOW VARIABLES LIKE 'log_%';`和`SHOW MASTER STATUS;`命令获取当前日志文件及位置。 3. **创建数据备份**:确保在恢复前已有备份,以防意外。 4. **导出二进制日志为SQL语句**:使用`mysqlbinlog`
                          87 2
                          |
                          1月前
                          |
                          SQL 关系型数据库 MySQL
                          数据库数据恢复—Mysql数据库表记录丢失的数据恢复方案
                          Mysql数据库故障: Mysql数据库表记录丢失。 Mysql数据库故障表现: 1、Mysql数据库表中无任何数据或只有部分数据。 2、客户端无法查询到完整的信息。
                          |
                          1月前
                          |
                          关系型数据库 MySQL 数据库
                          数据库数据恢复—MYSQL数据库文件损坏的数据恢复案例
                          mysql数据库文件ibdata1、MYI、MYD损坏。 故障表现:1、数据库无法进行查询等操作;2、使用mysqlcheck和myisamchk无法修复数据库。
                          |
                          1月前
                          |
                          SQL 存储 缓存
                          MySQL进阶突击系列(02)一条更新SQL执行过程 | 讲透undoLog、redoLog、binLog日志三宝
                          本文详细介绍了MySQL中update SQL执行过程涉及的undoLog、redoLog和binLog三种日志的作用及其工作原理,包括它们如何确保数据的一致性和完整性,以及在事务提交过程中各自的角色。同时,文章还探讨了这些日志在故障恢复中的重要性,强调了合理配置相关参数对于提高系统稳定性的必要性。
                          |
                          2月前
                          |
                          关系型数据库 MySQL 数据库
                          【赵渝强老师】MySQL的binlog日志文件
                          MySQL的binlog日志记录了所有对数据库的更改操作(不包括SELECT和SHOW),主要用于主从复制和数据恢复。binlog有三种模式,可通过设置binlog_format参数选择。示例展示了如何启用binlog、设置格式、查看日志文件及记录的信息。
                          243 6
                          |
                          2月前
                          |
                          存储 SQL 关系型数据库
                          mysql 的ReLog和BinLog区别
                          MySQL中的重做日志(Redo Log)和二进制日志(Binary Log)是两种重要的日志系统。重做日志主要用于保证事务的持久性和原子性,通过记录数据页的物理修改信息来恢复未提交的事务更改。二进制日志则记录了数据库的所有逻辑变化操作,用于数据的复制、恢复和审计。两者在写入时机、存储方式、配置参数和使用范围上有所不同,共同确保了数据库的稳定性和可靠性。
                          |
                          3月前
                          |
                          存储 关系型数据库 MySQL
                          MySQL中的Redo Log、Undo Log和Binlog:深入解析
                          【10月更文挑战第21天】在数据库管理系统中,日志是保障数据一致性和完整性的关键机制。MySQL作为一种广泛使用的关系型数据库管理系统,提供了多种日志类型来满足不同的需求。本文将详细介绍MySQL中的Redo Log、Undo Log和Binlog,从背景、业务场景、功能、底层实现原理、使用措施等方面进行详细分析,并通过Java代码示例展示如何与这些日志进行交互。
                          402 0
                          |
                          4月前
                          |
                          canal 消息中间件 关系型数据库
                          Canal作为一款高效、可靠的数据同步工具,凭借其基于MySQL binlog的增量同步机制,在数据同步领域展现了强大的应用价值
                          【9月更文挑战第1天】Canal作为一款高效、可靠的数据同步工具,凭借其基于MySQL binlog的增量同步机制,在数据同步领域展现了强大的应用价值
                          933 4

                          热门文章

                          最新文章