pt-online-schema-change你今天滥用了吗?

本文涉及的产品
RDS MySQL Serverless 基础系列,0.5-2RCU 50GB
云数据库 RDS MySQL,集群系列 2核4GB
推荐场景:
搭建个人博客
RDS MySQL Serverless 高可用系列,价值2615元额度,1个月
简介:

注:本文来自真实生产案例,感谢网友小豚提供,本人加以故障重现校验。


场景

因想整理一下线上的独立表空间碎片,故使用了pt-online-schema-changeslave从库上执行,目的是怕影响主库的CPU,维护的时候再进行一次主从切换,然后再收缩主库上的表空间碎片。

slave从库上执行的命令如下:

1
2
3
# pt-online-schema-change -S /tmp/mysql.sock --alter="engine=innodb"  
--no-check-replication-filters  --recursion-method=none
--user=root D= test ,t=sbtest --execute


故障

DBA在修改完表结构以后,业务方反馈数据不准确,在排查的过程中发现同步报错1032

 

分析

1、主库和从库的binlog格式为ROW

wKiom1hGTjSjAMYEAAAKJHbkX34384.png


2、pt-online-schema-change在拷贝原表数据时,原表的数据变更会通过触发器insert/updete/delete到临时表_sbtest_new里,完成之后原表改名为_sbtest_old老表,_sbtest_new临时表改为原表sbtest,最后删除_sbtest_old老表。过程如下:

1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16
17
Altering ` test `.`sbtest`...
Creating new table...
Created new table  test ._sbtest_new OK.
Altering new table...
Altered ` test `.`_sbtest_new` OK.
2016-12-06T12:15:30 Creating triggers...
2016-12-06T12:15:30 Created triggers OK.
2016-12-06T12:15:30 Copying approximately 1099152 rows...
2016-12-06T12:15:54 Copied rows OK.
2016-12-06T12:15:54 Analyzing new table...
2016-12-06T12:15:54 Swapping tables...
2016-12-06T12:15:54 Swapped original and new tables OK.
2016-12-06T12:15:54 Dropping old table...
2016-12-06T12:15:54 Dropped old table ` test `.`_sbtest_old` OK.
2016-12-06T12:15:54 Dropping triggers...
2016-12-06T12:15:54 Dropped triggers OK.
Successfully altered ` test `.`sbtest`.


3、基于binlogROW行的复制,触发器不会在slave从库上工作,这就导致了主从数据不一致。但基于binlogstatement语句的复制,触发器会在slave从库上工作。

With statement-based replication, triggers executed on the master also execute on the slave. With row-based replication, triggers executed on the master do not execute on the slave.

参考文献:http://dev.mysql.com/doc/refman/5.7/en/replication-features-triggers.html

 

注:在二进制日志里,MIXED默认还是采用STATEMENT格式记录的,但在下面这6种情况下会转化为ROW格式

第一种情况:NDB引擎,表的DML操作增、删、改会以ROW格式记录。

第二种情况:SQL语句里包含了UUID()函数。

第三种情况:自增长字段被更新了。

第四种情况:包含了INSERT DELAYED语句。

第五种情况:使用了用户定义函数(UDF

第六种情况:使用了临时表。

参考文献:https://dev.mysql.com/doc/refman/5.7/en/binary-log-mixed.html


复现

1、主库创建t1

1
2
3
4
  CREATE TABLE `t1` (
   ` id ` int(11) NOT NULL,
   PRIMARY KEY (` id `)
) ENGINE=InnoDB DEFAULT CHARSET=utf8


2、从库创建t2表并创建触发器

1
2
3
4
CREATE TABLE `t2` (
   ` id ` int(11) NOT NULL,
   PRIMARY KEY (` id `)
) ENGINE=InnoDB DEFAULT CHARSET=utf8


触发器

1
2
3
4
5
6
7
8
9
10
11
12
13
14
DELIMITER $$
  
USE ` test `$$
  
DROP TRIGGER IF EXISTS `t1_1`$$
  
CREATE
     TRIGGER `t1_1` AFTER INSERT ON `t1` 
     FOR EACH ROW BEGIN
     INSERT INTO t2( id ) VALUES(NEW. id );
     END;
$$
  
DELIMITER ;


3、主库插入

1
2
insert into t1 values(1),(2),(3);
select  * from t2;

此时t2表里没有任何数据,触发器没有工作。


结论

如果你使用pt-online-schema-change修改表结构在主库上运行,数据不一致的情况不会发生。但如果在从库上运行,且主库的binlog格式为ROW,那将是危险的。






















本文转自hcymysql51CTO博客,原文链接:http://blog.51cto.com/hcymysql/1879962 ,如需转载请自行联系原作者



相关实践学习
如何在云端创建MySQL数据库
开始实验后,系统会自动创建一台自建MySQL的 源数据库 ECS 实例和一台 目标数据库 RDS。
全面了解阿里云能为你做什么
阿里云在全球各地部署高效节能的绿色数据中心,利用清洁计算为万物互联的新世界提供源源不断的能源动力,目前开服的区域包括中国(华北、华东、华南、香港)、新加坡、美国(美东、美西)、欧洲、中东、澳大利亚、日本。目前阿里云的产品涵盖弹性计算、数据库、存储与CDN、分析与搜索、云通信、网络、管理与监控、应用服务、互联网中间件、移动服务、视频服务等。通过本课程,来了解阿里云能够为你的业务带来哪些帮助     相关的阿里云产品:云服务器ECS 云服务器 ECS(Elastic Compute Service)是一种弹性可伸缩的计算服务,助您降低 IT 成本,提升运维效率,使您更专注于核心业务创新。产品详情: https://www.aliyun.com/product/ecs
相关文章
|
存储 关系型数据库 MySQL
|
SQL 关系型数据库 MySQL
pt-tools系列:pt-online-schema-change 最佳实践
pt的详细步骤 Step 1: Create the new table. Step 2: Alter the new, empty table. This should be very quick, or die if the user specified a bad alter statement.
5062 0
|
Oracle 关系型数据库 数据库
change backup ... for db_unique_name不同步到control file
change backup … for db_unique_name 可以改变备份集所属的db_unique_name,但oracle官方文档里面没有说会不会同步到db_unique_name对应的数据库的control file。我自己测试发现不会同步到control file。
|
存储 SQL 监控
Oracle BCT(Block Change Tracking)与增量备份---发表在数据和云
BCT(Block Change Tracking)是Oracle从10g开始有的特性。BCT的原理是记录数据文件里每个数据块的变化,并把这些变化信息保存在BCT的跟踪文件中。
408 0
|
SQL 运维 前端开发
【MySQL】pt-online-schema-change 工具使用
在运维mysql数据库时,我们总会对数据表进行ddl 变更,修改添加字段或者索引,对于mysql 而已,ddl 显然是一个令所有MySQL dba 诟病的一个功能,因为在MySQL中在对表进行ddl时,会锁表,当表比较小比如小于1w上时,对前端影响较小,当时遇到千万级别的表 就会影响前端应用对表的写操作。
393 0
|
MySQL 关系型数据库
|
关系型数据库 MySQL SQL