什么是Keepalived呢,keepalived观其名可知,保持存活,在网络里面就是保持在线了,也就是所谓的高可用或热备,用来防止单点故障(单点故障是指一旦某一点出现故障就会导致整个系统架构的不可用)的发生,那说到keepalived时不得不说的一个协议就是VRRP协议,可以说这个协议就是keepalived实现的基础,那么首先我们来看看VRRP协议
一,keepalived的原理
1,VRRP协议
学过网络的朋友都知道,网络在设计的时候必须考虑到冗余容灾,包括线路冗余,设备冗余等,防止网络存在单点故障,那在路由器或三层交换机处实现冗余就显得尤为重要,在网络里面有个协议就是来做这事的,这个协议就是VRRP协议,Keepalived就是巧用VRRP协议来实现高可用性(HA)的
2,keepalived也是模块化设计,不同模块复杂不同的功能,下面是keepalived的组件
core check vrrp libipfwc libipvs-2.4 libipvs-2.6
core:是keepalived的核心,复杂主进程的启动和维护,全局配置文件的加载解析等
check:负责healthchecker(健康检查),包括了各种健康检查方式,以及对应的配置的解析包括LVS的配置解析
vrrp:VRRPD子进程,VRRPD子进程就是来实现VRRP协议的
libipfwc:iptables(ipchains)库,配置LVS会用到
libipvs*:配置LVS会用到
注意,keepalived和LVS完全是两码事,只不过他们各负其责相互配合而已
keepalived启动后会有三个进程
父进程:内存管理,子进程管理等等
子进程:VRRP子进程
子进程:healthchecker子进程
有图可知,两个子进程都被系统WatchDog看管,两个子进程各自复杂自己的事,healthchecker子进程复杂检查各自服务器的健康程度,例如HTTP,LVS等等,如果healthchecker子进程检查到MASTER上服务不可用了,就会通知本机上的兄弟VRRP子进程,让他删除通告,并且去掉虚拟IP,转换为BACKUP状态
二,keepalived安装
1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16
17
18
|
[root@test1 ~]# wget http: //www.keepalived.org/software/keepalived-1.2.1.tar.gz
[root@test1 ~]# tar zxvf keepalived- 1.2 . 1 .tar.gz
[root@test1 ~]# cd keepalived- 1.2 . 1
[root@test1 keepalived- 1.2 . 1 ]# ./configure --prefix=/usr/local/keepalived
[root@test1 keepalived- 1.2 . 1 ]# make && make install
安装排错: 1 ,
configure: error: !!! OpenSSL is not properly installed on your system. !!!
!!! Can not include OpenSSL headers files. !!!
解决方法: [root@test1 keepalived- 1.2 . 1 ]# yum install -y openssl-devel
2 ,
Use IPVS Framework : No IPVS sync daemon support : No 这里不是必须的,但是还是建议大家安装上 [root@test1 keepalived- 1.2 . 1 ]# cd /usr/src/kernels/
[root@test1 kernels]# yum install -y kernel-devel ipvsadm [root@test1 ~]# ln -s /usr/src/kernels/ 2.6 . 18 - 194 .el5-x86_64/ /usr/src/linux
|
三、keepalived安装验证
1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16
17
|
1 ,检查目录及相应的文件信息
[root@test1 ~]# cd /usr/local/keepalived/ bin/ etc/ sbin/ share/ 2 ,启动设置
[root@test1 ~]# cp /usr/local/keepalived/etc/sysconfig/keepalived /etc/sysconfig/ [root@test1 ~]# cp /usr/local/keepalived/etc/rc.d/init.d/keepalived /etc/init.d/ [root@test1 ~]# mkdir /etc/keepalived [root@test1 ~]# cp /usr/local/keepalived/etc/keepalived/keepalived.conf /etc/keepalived/ [root@test1 ~]# cp /usr/local/keepalived/sbin/keepalived /usr/sbin/ [root@test1 ~]# service keepalived start Starting keepalived: [ OK ] [root@test1 ~]# ps aux|grep keepalived root 18846 0.0 0.1 35832 620 ? Ss 04 : 33 0 : 00 keepalived -D
root 18847 0.2 0.3 37924 1556 ? S 04 : 33 0 : 00 keepalived -D
root 18848 0.0 0.2 37924 1028 ? S 04 : 33 0 : 00 keepalived -D
Keepalived正常运行时,共启动 3 个进程,其中一个进程时父进程,负责监控其子
进程,一个是vrrp子进程;另外一个是checkers子进程。
|
四,keepalived.conf的配置
1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16
17
18
19
20
21
22
23
24
25
26
27
28
29
30
31
32
33
34
35
36
37
38
39
40
41
42
43
44
45
46
47
48
49
50
51
52
53
54
55
56
57
58
59
60
61
62
63
64
65
66
67
68
69
70
71
72
73
74
75
76
77
78
79
80
81
82
83
84
85
86
87
88
89
90
91
92
93
94
95
96
97
98
99
100
101
102
103
104
105
|
global_defs { notification_email { #指定keepalived在发生切换时需要发送email到的对象,一行一个
}
notification_email_from #指定发件人
smtp_server localhost #指定smtp服务器地址
smtp_connect_timeout 30 #指定smtp连接超时时间
router_id LVS_DEVEL #运行keepalived机器的一个标识
} vrrp_sync_group VG_1{ #监控多个网段的实例 group {
inside_network #实例名
outside_network
}
notify_master /path/xx.sh #指定当切换到master时,执行的脚本
netify_backup /path/xx.sh #指定当切换到backup时,执行的脚本
notify_fault "path/xx.sh VG_1" #故障时执行的脚本
notify /path/xx.sh
smtp_alert #使用global_defs中提供的邮件地址和smtp服务器发送邮件通知
} vrrp_instance inside_network { state BACKUP #指定那个为master,那个为backup,如果设置了nopreempt这个值不起作用,主备靠priority决定
interface eth0 #设置实例绑定的网卡
dont_track_primary #忽略vrrp的 interface 错误(默认不设置)
track_interface{ #设置额外的监控,里面那个网卡出现问题都会切换
eth0
eth1
}
mcast_src_ip #发送多播包的地址,如果不设置默认使用绑定网卡的primary ip
garp_master_delay #在切换到master状态后,延迟进行gratuitous ARP请求
virtual_router_id 50 #VPID标记
priority 99 #优先级,高优先级竞选为master
advert_int 1 #检查间隔,默认 1 秒
nopreempt #设置为不抢占 注:这个配置只能设置在backup主机上,而且这个主机优先级要比另外一台高
preempt_delay #抢占延时,默认 5 分钟
debug #debug级别
authentication { #设置认证
auth_type PASS #认证方式
auth_pass 111111 #认证密码
}
virtual_ipaddress { #设置vip
192.168 . 202.200
}
} virtual_server 192.168 . 202.200 23 {
delay_loop 6 #健康检查时间间隔
lb_algo rr #lvs调度算法rr|wrr|lc|wlc|lblc|sh|dh
lb_kind DR #负载均衡转发规则NAT|DR|RUN
persistence_timeout 5 #会话保持时间
protocol TCP #使用的协议
persistence_granularity <NETMASK> #lvs会话保持粒度
virtualhost <string> #检查的web服务器的虚拟主机(host:头)
sorry_server<IPADDR> <port> # 备用机,所有realserver失效后启用
real_server 192.168 . 200.5 23 {
weight 1 #默认为 1 , 0 为失效
inhibit_on_failure #在服务器健康检查失效时,将其设为 0 ,而不是直接从ipvs中删除
notify_up <string> | <quoted-string> #在检测到server up后执行脚本
notify_down <string> | <quoted-string> #在检测到server down后执行脚本
TCP_CHECK {
connect_timeout 3 #连接超时时间
nb_get_retry 3 #重连次数
delay_before_retry 3 #重连间隔时间
connect_port 23 健康检查的端口的端口
bindto <ip>
}
HTTP_GET | SSL_GET{
url{ #检查url,可以指定多个
path /
digest <string> #检查后的摘要信息
status_code 200 #检查的返回状态码
}
connect_port <port>
bindto <IPADD>
connect_timeout 5
nb_get_retry 3
delay_before_retry 2
}
SMTP_CHECK{
host{
connect_ip <IP ADDRESS>
connect_port <port> #默认检查 25 端口
bindto <IP ADDRESS>
}
connect_timeout 5
retry 3
delay_before_retry 2
helo_name <string> | <quoted-string> #smtp helo请求命令参数,可选
}
MISC_CHECK{
misc_path <string> | <quoted-string> #外部脚本路径
misc_timeout #脚本执行超时时间
misc_dynamic #如设置该项,则退出状态码会用来动态调整服务器的权重,返回 0 正常,不修改;返回 1 ,
检查失败,权重改为 0 ;返回 2 - 255 ,正常,权重设置为:返回状态码- 2
}
}
} real_server 192.168 . 0.20 80 { //真实IP web的IP
weight 1 //默认为1,0为失效
HTTP_GET {
connect_port 80 //健康检查端口
connect_timeout 3 //链接超时时间
nb_get_retry 3 //重链次数
delay_before_retry 3 //重连讲时间(秒)
}
}
} |