今天这篇文章接着昨天的相关知识,一样是为了前天刚做的mysql热备;
大家知道实现mysql_Ha的方案有很多,常见的heartbeat、keepalived,这里说的就是keepalived,优点就是简单,快速,下面就是详情了;
1、系统:Centos6.0;lamp平台(lamp平台是我一个习惯,非必须)
vip:192.168.135.200
master:192.168.135.134
slave:192.168.135.135
实现134实时复制135,135实时复制134,也就是说修改每一个数据库都会数据统一,master机器配置好点,我这边配置preempt(抢占),也就说134挂了以后,135提供服务,134恢复以后,继续134为master提供服务;
master(192.168.135.134)操作:
yum install http mysql* php* ipvsadm keepalived -y
1>、修改MySQL配置文件
两台MySQL均要开启binlog日志功能,在MySQL配置文件[MySQLd]段中加上log-bin=mysql-bin选项
两台MySQL的server-ID不能一样,默认情况下两台MySQL的serverID都是1,、其中一台修改为2;
2>、初始化下服务
service httpd restart
service mysqld restart
关闭服务:service iptables stop
修改selinux
3>、首先先将两台机器的同步做好;
master:同步slave上的数据库
授权用户;grant replication slave on *.* to 'leo'@'%' identified by 'leo123';
查询主数据库状态;并记下FILE及Position的值,这个在后面配置从服务器的时候要用到。
在另一台(slave)机器操作将此台机器设置为主服务器
change master to master_host='192.168.135.134',master_user='leo',master_password='leo123',master_log_file='mysql-bin.000001',master_log_pos=106;
授权用户;
grant replication slave on *.* to 'leo'@'%' identified by 'leo123';
同样查询主数据库状态
在另一台(master)机器操作将此台机器设置为主服务器
change master to master_host='192.168.135.135',master_user='leo',master_password='leo123',master_log_file='mysql-bin.000001',master_log_pos=247;
然后两台机器同时启动slave
start slave
查看slave状态
检查主从同步,如果您看到Slave_IO_Running和Slave_SQL_Running均为Yes,则主从复制连接正常。
show slave status\G
重点查看圈住的地方
在slave机器上同样查看是否正常
test:现在在两台服务器上其中一台,修改下数据,看看另一台的状况是否也修改,比如:
在另一台发现已经同步过去了;
2、接下来配置keepalived
vim /etc/keepalived/keepalived.conf
! Configuration File for keepalived
全局定义(global definition)配置
global_defs {
notification_email {
coffee_lanshan@sina.com 故障联系人
}
notification_email_from admin@example.com 故障发送人
smtp_server 127.0.0.1
smtp_connect_timeout 30
router_id Mysql_ha
}
global_defs全局配置标识
notification_email
{
coffee_lanshan@sina.com
lansgg@sina.com
}
VRRP实例(instance)
vrrp_instance mysql{
state MASTER state 指定instance(Initial)的初始状态,实质是经过优先级决定
interface eth0 实例绑定的网卡,因为在配置虚拟IP的时候必须是在已有的网卡上添加的
virtual_router_id 50 这里设置VRID,这里非常重要,相同的VRID为一个组,他将决定多播的MAC地址
priority 100 设置本节点的优先级,优先级高的为master
advert_int 1 检查间隔,默认为1秒
preempt 设置抢占,这里只能设置在state为master的节点上,而且这个节点的优先级必须别另外的高
authentication {
auth_type PASS 认证方式,可以是PASS或AH两种认证方式
auth_pass 123456 认证密码
}
virtual_ipaddress {
192.168.152.200 这里设置的就是VIP,也就是虚拟IP地址,他随着state的变化而增加删除,
}
}
virtual_server 192.168.135.200 3306 { 设置一个virtual server: VIP:Vport
delay_loop 2 service polling的delay时间,即服务轮询的时间间隔
lb_algo wrr LVS调度算法 rr|wrr|lc|wlc|lblc|sh|dh
lb_kind DR LVS集群模式 NAT|DR|TUN
persistence_timeout 60 会话保持时间(秒为单位),即以用户在120秒内被分配到同一个后端realserver
protocol TCP 健康检查用的是TCP还是UDP
real_server 192.168.135.134 3306 { 后端真实节点主机的权重等设置,主要,后端有几台这里就要设置几个
weight 3 给每台的权重,0表示失效(不知给他转发请求知道他恢复正常),默认是1
# notify_up <STRING> | <QUOTED-STRING> #检查服务器正常(UP)后,要执行的脚本
notify_down /usr/local/Mysql/bin/mysql.sh 检查服务器失败(down)后,要执行的脚本
#下面是常用的健康检查方式,健康检查方式一共有HTTP_GET|SSL_GET|TCP_CHECK|SMTP_CHECK|MISC_CHECK这些方式
TCP_CHECK {
connect_timeout 10
nb_get_retry 3
delay_before_retry 3
connect_port 3306
}
}
}
编写检测服务down后所要执行的脚本
#!/bin/sh
pkill keepalived
简单吧,只要mysqld进程不见了,就杀掉keepalived,让备机顶替
3、在备机操作keepalived
上master的基本一样,只是几个地方修改下而已
global_defs {
notification_email {
coffee_lanshan@sina.com
}
notification_email_from admin@example.com
smtp_server 127.0.0.1
smtp_connect_timeout 30
router_id Mysql_ha
}
vrrp_instance VI_1 {
state BACKUP
interface eth0
virtual_router_id 51
priority 90
advert_int 1
nopreempt
authentication {
auth_type PASS
auth_pass 123456
}
virtual_ipaddress {
192.168.135.200
}
}
virtual_server 192.168.135.200 3306 {
delay_loop 2
lb_algo wrr
lb_kind DR
persistence_timeout 10
protocol TCP
real_server 192.168.135.135 3306 {
weight 3
notify_down /usr/local/Mysql/bin/mysql.sh
TCP_CHECK {
connect_timeout 10
nb_get_retry 3
delay_before_retry 3
connect_port 3306
}
}
}
找一台机器进行测试
ping 192.168.135.200(vip)
正常,当把master上mysqld杀掉,发现keepalived进程也不见了,说明我们的脚本触发了,但是vip还是可以ping通,说明备机起作用了;
大家也可以查看vrrp协议的信息;根据优先级100或90进行判断
黑线的地方说明备机顶替了;
当把master的mysqld进程和keepalived重启后发现:
说明master又顶替了slave;进行了抢占
继续测试
再两台机器上授权远程登录、操作
grant all privileges on *.* to 'root'@'%' identified by '1234567890';
找一台机器mysql -h 192.168.135.200 -p 1234567890
可以进行查看,当你新增,比如create个数据库,发现两台机器也是可以同步的,过程是你先写入了当前服务的机器,然后另一台进行了同步;
为了方便查看keepalived的日志,我们可以单独将他的日志写入个日志文件,请查看前面的博文
http://lansgg.blog.51cto.com/5675165/1178903
当我们将服务器更换IP或是停掉slave,然后开启后发现其状态异常,
show slave status\G 可以看到,表现如下
解决方法如下:
分别在两台机器
stop slave;
flush logs;
show master status;
再次分别执行:
change master to master_host='192.168.135.XXX',master_user='leo',master_password='leo123',master_log_file='mysql-bin.XXXXXX',master_log_pos=XXX;
提示 不同步Mysql数据库,当上线后,发现修改一个机器的密码,两台机器重启服务后,另一台机器的密码也修改了,只要修改my.cnf即可让其不同步Mysql数据库
新加:binlog-ignore-db=mysql (不同步mysql库)
在show master status;是可以看到的
同样发现,新加binlog_do_db=xxx可以指定同步某库
这样即可;
大概先写到这里,以后会编写heartbeat的方法,希望大家可以多多交流,指出问题,共同进步
本文转自 西索oO 51CTO博客,原文链接:http://blog.51cto.com/lansgg/1180305