主从复制中常会遇到的问题就是1062主键重复、1023slave上相关记录没找到。
如果在读写分离的架构中,slave同步失败会对业务造成很大的影响的(比如用户在master上发了帖子,阅览跑到了slave上,找不到了刚才的帖子了)。
因此,我们很有必要对主从复制做些监控,做些自动化的处理。
这里要涉及到MySQL的一个参数slave_exec_mode
slave_exec_mode参数可用来自动处理同步复制错误:
1
2
3
4
|
> set global slave_exec_mode= 'IDEMPOTENT' ; 幂等模式 (默认是STRICT严格模式)
> stop slave;
> start slave;
|
经过上面3步的设置后,当出现1023错误(记录没找到)、1062错误(主键重复)时,就会自动跳过错误,并且记录到错误日志里。
其实,slave_exec_mode和slave_skip_errors的作用是一样的,但是slave_skip_errors不支持动态修改,必须重启mysql才能生效,因此建议使用slave_exec_mode。
脚本方法如下 cat /home/scripts/manage_repl.sh:
1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16
17
18
19
|
#!/bin/bash
user= 'root'
pass= 'root'
port= '3306'
IP= '172.16.10.10'
MYSQLCLI= '/usr/local/mysql/bin/mysql'
STATUS=$($MYSQLCLI -u$user -p$pass -h $IP -e 'show slave status\G' | sed -n '13p' | awk -F ":" '{print $2}' )
if [[ $STATUS != 'YES' ]]; then
$MYSQLCLI -u$user -p$pass -h $IP -e "SET GLOBAL slave_exec_mode='IDEMPOTENT';"
$MYSQLCLI -u$user -p$pass -h $IP -e "stop slave';"
$MYSQLCLI -u$user -p$pass -h $IP -e "start slave';"
echo -e "地址: $IP\n端口: 3306\n服务: MySQL主从复制发生错误,系统已自动跳过错误,请后续跟进处理。\n发生时间: `date +" %F %T "`" \
| mail -s '主从复制错误警告' xxxxxx@126.com
fi
|
添加一个每隔10分钟检查一次主从复制状态的计划任务,如下:
1
|
echo '*/10 * * * * /home/scripts/manage_repl.sh' >> /var/spool/cron/root
|
本文转自 lirulei90 51CTO博客,原文链接:http://blog.51cto.com/lee90/1793469,如需转载请自行联系原作者