Linux双机热备解决方案之Heartbeat

简介: Linux双机热备解决方案之Heartbeat

拓扑图:

085615163.jpg

环境描述:

操作系统:CentOS6.3_x64

主:eth0 192.168.10.10 心跳:eth1 192.168.1.10

备:eth0 192.168.10.20 心跳:eth1 192.168.1.20

VTP:192.168.128.5

heartbeat(Linux-HA)的工作原理:heartbeat最核心的包括两个部分,心跳监测部分和资源接管部分,心跳监测可以通过网络链路和串口进行,而且支持冗余链路,它们之间相互发送报文来告诉对方自己当前的状态,如果在指定的时间内未受到对方发送的报文,那么就认为对方失效,这时需启动资源接管模块来接管运 行在对方主机上的资源或者服务。

Heartbeat:(心跳检测)本身是整个集群的基础(cluster messaging layer),负责维护集群各节点的信息以及它们之前通信;只提供主从备份功能,并不能对各个节点进行监控,需要安装ldirectord。

Resource-agent:(资源代理)就是各种的资源的ocf脚本,这些脚本将被LRM调用从而实现各种资源启动、停止、监控等等。

Cluster-glue:相当于一glue:相当于一个中间可以将heartbeat和crm(pacemaker)联系起来,主要包含2个部分,LRM和STONITH;

Ldirectord:负责realserver的健康检查,可以自动将realserver中宕机的机器移除,不再分配请求。

安装依赖包:

yum install -y gcc gcc-c++ autoconf libtool pkgconfig glib2-devel libxslt-devel libxml2-devel bzip2-devel libtool-ltdl-devel libuuid-devel docbook-style-xsl

安装资源接管服务依赖包:

yum install -y *Socket6* *libwww-perl* *URI* *MailTools* *HTML-Parser* perl-IO-Socket-*

配置host解析

vi /etc/hosts

192.168.10.10 master

192.168.10.20 slave

软件下载:http://www.linux-ha.org/wiki/Downloads

一、配置主从heartbeat服务器(配置相同)

创建需要的组和用户

groupadd haclient
useradd -g haclient -s /sbin/nologin -M hacluster

1.安装资源接管服务(要先安装资源接管服务,否则安装心跳服务会报错)

tar zxvf Reusable-Cluster-Components-glue--glue-1.0.9.tar.bz2
cd Reusable-Cluster-Components-glue--glue-1.0.9
./autogen.sh
./configure
make && make install

2.安装心跳服务

tar jxvf Heartbeat-3-0-7e3a82377fa8.tar.bz2
cd Heartbeat-3-0-7e3a82377fa8
./ConfigureMe configure
make && make install


报错:./configure: error: Core development headers were not found

解决:./ConfigureMe configure ,如果还解决不了,就是你没有安装Heartbeat服务

报错:gmake[1]: --xinclude: Command not found ,gmake[1]: *** [heartbeat.8] Error 127

解决:yum install libxslt-devel

3.安装中间件服务

tar jxvf ClusterLabs-resource-agents-v3.9.2-0-ge261943.tar.gz
cd ClusterLabs-resource-agents-b735277
./autogen.sh
./configure
make && make install

报错:syntax error near unexpected token `DBUS,

解决:vi configure,注释这行PKG_CHECK_MODULES(DBUS, dbus-1, dbus-glib-1)

二、配置heartbeat

/etc/ha.d/ha.cf #定义心跳信息层,用于实现心跳信息传输。
/etc/ha.d/haresources #本地最重要的CRM,这个文件我们使用v1版本的配置文件,很简单。
/etc/ha.d/authkeys #实现两个节点之间传递,对心跳信息进行签名,或者加密,避免篡改;authkeys的权限非常重要,通常是400或者600的,如果设置不对无法启动heartbeat服务。
rm -rf /usr/etc/ha.d
ln -s /etc/ha.d /usr/etc
cp /usr/share/doc/heartbeat/haresources /etc/ha.d
cp /usr/share/doc/heartbeat/authkeys /etc/ha.d
cp /usr/share/doc/heartbeat/ha.cf /etc/ha.d
chmod 600 /etc/ha.d/authkeys
chkconfig heartbeat on

1.修改配置文件

vi authkeys
auth 2
#1 crc
2 sha1 HI!
#3 md5 Hello!
vi ha.cf
logfile /var/log/ha-log
logfacility local0 #如果未定义上述日志,默认写入/var/log/message
keepalive 2 #心跳间隔
deadtime 30 #死亡阀值
warntime 10 #警告时间
initdead 120 #首次启动heartbeat,等待多久才启动主服务资源
udpport 694 #连接端口
ucast eth1 192.168.1.20 #采用网卡的eth1组织心跳,后跟接口IP
auto_failback on #当主节点故障恢复后,自动获取资源并取代从节点
node master #主节点主机名
node slave #备份节点主机名
ping 192.168.1.1 #选择ping节点,ping的越好对HA集群越稳定,建议使用网关
vi haresources
master IPaddr::192.168.128.5 ldirectord::ldirectord.cf httpd
#格式:[主机名] [资源名与虚拟ip] [资源名与脚本] [高可用服务]
#每个资源都是一个shell脚本,后面还可以写虚拟IP和资源,heartbeat会使用init脚本来管理系统服务,在范围内搜索脚本并启用
scp -r /etc/ha.d root@slave:/etc/ha.d #配置好的复制到备份服务器上
rm -rf /usr/etc/ha.d
ln -s /etc/ha.d /usr/etc

2.配置ldirectord

cp ClusterLabs-resource-agents-b735277/ldirectord/ldirectord.cf /etc/ha.d/
vi /etc/ha.d/ldirectord.cf
checktimeout=3
checkinterval=1
autoreload=yes
quiescent=yes
virtual=192.168.128.5:80
    real=192.168.1.10:80 gate
    real=192.168.1.20:80 gate
    fallback=127.0.0.1:80 gate
    service=http
    scheduler=rr
    protocol=tcp
    checkport=80

三、测试

service iptables stop #关闭防火墙
setenforce 0 #临时关闭selinux
service heartbeat start
ifconfig #会显示192.168.0.100绑定在主服务器eth0:0
echo “192.168.10.10″ > /var/www/html/index.html
echo “192.168.10.20″ > /var/www/html/index.html

hearbeat启动报错:

/etc/init.d/heartbeat: line 53: /etc/ha.d/shellfuncs: No such file or directory

解决:这是因为没有装ClusterLabs-resource-agents导致的,装了这个中间件会把shellfuncs自动复制过去,我们可以手动复制过去即可。

cp ClusterLabs-resource-agents-b735277/heartbeat/shellfuncs /etc/ha.d/

http://192.168.128.5 #正常访问到192.168.10.10

模拟down掉192.168.10.10的httpd服务,再刷新页面显示192.168.10.20,说明配置成功!

生产环境中,网站程序数据必须是一致的,可以采用rsync进行同步或使用共享存储(NFS、ISCSI),后台MySQL数据库可以采用双主热备,实现高可用性。


相关文章
|
13天前
|
Prometheus 运维 监控
Prometheus+Grafana+NodeExporter:构建出色的Linux监控解决方案,让你的运维更轻松
本文介绍如何使用 Prometheus + Grafana + Node Exporter 搭建 Linux 主机监控系统。Prometheus 负责收集和存储指标数据,Grafana 用于可视化展示,Node Exporter 则采集主机的性能数据。通过 Docker 容器化部署,简化安装配置过程。完成安装后,配置 Prometheus 抓取节点数据,并在 Grafana 中添加数据源及导入仪表盘模板,实现对 Linux 主机的全面监控。整个过程简单易行,帮助运维人员轻松掌握系统状态。
97 3
|
4月前
|
Linux 编译器 开发工具
快速在linux上配置python3.x的环境以及可能报错的解决方案(python其它版本可同样方式安装)
这篇文章介绍了在Linux系统上配置Python 3.x环境的步骤,包括安装系统依赖、下载和解压Python源码、编译安装、修改环境变量,以及常见安装错误的解决方案。
359 1
|
8月前
|
算法 Ubuntu Linux
Linux Qt cannot find -lGL错误完美解决方案(亲测有效)
Linux Qt cannot find -lGL错误完美解决方案(亲测有效)
678 1
|
5月前
|
Linux 网络安全 Python
Linux离线安装Python时ssh和hashlib死活安装不上的解决方案
本文提供了Linux环境下离线安装Python时遇到的"ImportError: No module named _ssl"和"ERROR:root:code for hash md5|sha1|sha224|sha256|sha384|sha512 was not found"两个问题的解决方案,通过设置OpenSSL环境变量和编辑Python源码配置文件来解决。
99 1
|
5月前
|
缓存 负载均衡 监控
在Linux中,HAProxy、Keepalived或Heartbeat在高可用性解决方案中有何作用?
在Linux中,HAProxy、Keepalived或Heartbeat在高可用性解决方案中有何作用?
|
6月前
|
存储 Java Linux
Linux环境变量配置及常见问题解决方案
Linux环境变量配置及常见问题解决方案
|
7月前
|
存储 Java Linux
Linux环境变量配置及常见问题解决方案
Linux环境变量配置及常见问题解决方案
|
8月前
|
网络协议 安全 Linux
Linux SSH与DNS:从连接问题诊断到专业解决方案
Linux SSH与DNS:从连接问题诊断到专业解决方案
544 1
|
8月前
|
Ubuntu Linux 网络安全
Linux(31)Rockchip RK3568 Ubuntu22.04上部署 Docker: 问题与解决方案
Linux(31)Rockchip RK3568 Ubuntu22.04上部署 Docker: 问题与解决方案
561 0
|
8月前
|
Ubuntu Linux 开发工具
WSL2(3)安装Linux headers完美解决方案
WSL2(3)安装Linux headers完美解决方案
823 0