主从同步常见故障-阿里云开发者社区

开发者社区> 开发与运维> 正文

主从同步常见故障

简介:
主从同步,常见故障!
1、在master上删除一条记录,在slave上找不到。

Last_SQL_Error.Could not execute Delete_rows event on table ….Error_code:1032……

2、主键冲突,在slave已经有该记录,     又在master上插入了同一条记录

Last_SQL_Error.Could not execute Write_rows event on table…… Error_Code :1062……

3、在master上更新一条记录,在slave上找不到数据

Last_SQL_Error.Could not execute Update_rows event …… Error_Code: 1032……

 
以上三种情况在HA切换过程中,由于异步复制且sync_binlog=0 时,会造成小部分binlog 没接受完而导致报错。
4、slave中继日志损坏

Last_SQL_Error:Error initializing relay log postion: I/O error reading the header from the binary log

Last_SQL_Error:Error initializing relay log positon:Binlog has bad magic number:it’s not a binary log file that can be used by this version of MySQL.

Slave 宕机或非法关机,电源故障、硬件故障,造成中继日志损坏。
 
解决方法:

对于第一种情况: master要删除一条记录,而slave上找不到相应记录而报错。Master上已经删除,slave 并没有改记录,可以直接跳过:

Stop slave ; set global sql_slave_skip_counter=1;start slave;
 
对于监控的情况: 出现情况报警,如何控制呢? 调用脚本?
 
对于第二种情况的处理:对于重复的记录,需要删除重复的键值。!
 
第三种情况: master更新的记录,在slave上找不到。通过 Mysqlbinlog 分析出真实的语句,将slave缺少的记录进行手动填充。!
 
第四种:找到salve 同步执行到master的位置。重新做同步。

        查找变量:

        Relay_Master_Log_File:

        Exec_Master_Log_Pos:

        从这两个位置重新同步。

 
 如果业务允许的话,可以设置下面两个变量:
slave-skip-errors=1022,1032,1062 (必须在 my.cnf中进行设置,只读的系统变量)

(1022 :Message: Can't write; duplicate key in table '%s'

(1032: Message: Can't find record in '%s')

(1062: Message: Duplicate entry '%s' for key %d)

slave_exec_mode (可在全部变量中进行设置)

可选项为STRICT(默认)和IDEMPOTENT 模式, STRICT遇到任何问题,都会导致复制的停止。

IDEMPOTENT 对于 duplicate key 和 no-key-found错误跳过。

注:以上两个参数的设置,如果出现跳过的情况,则会在错误日志中进行记录。(如何把出现问题的时候 出现的监控中呢? 问题一!)

错误我们可以解决,那主从数据的一致性我们该如何验证呢?可以参考这边文章:

http://weipengfei.blog.51cto.com/1511707/976545

在出现主从数据不一致的情况,如何修复呢?






本文转自 位鹏飞 51CTO博客,原文链接:http://blog.51cto.com/weipengfei/1068258,如需转载请自行联系原作者

版权声明:本文内容由阿里云实名注册用户自发贡献,版权归原作者所有,阿里云开发者社区不拥有其著作权,亦不承担相应法律责任。具体规则请查看《阿里云开发者社区用户服务协议》和《阿里云开发者社区知识产权保护指引》。如果您发现本社区中有涉嫌抄袭的内容,填写侵权投诉表单进行举报,一经查实,本社区将立刻删除涉嫌侵权内容。

分享:
开发与运维
使用钉钉扫一扫加入圈子
+ 订阅

集结各类场景实战经验,助你开发运维畅行无忧

其他文章