Linux集群系统Heartbeat

简介:

1、理论部分

1.1、群集的分类

我们用到的集群系统主要就2种:

高可用(High Availability)HA集群, 使用Heartbeat实现;也会称为”双机热备”, “双机互备”, “双机”。

负载均衡群集(Load Balance Cluster),使用Linux Virtual Server(LVS)实现;

1.2、heartbeat的作用

通过heartbeat,可以将资源(IP以及服务等资源)从一台已经故障的计算机快速转移到另外一台正常运转的计算机上继续提供服务,一般称之为高可用服务。

1.3、heartbeat (Linux-HA)的工作原理

heartbeat最核心的包括两个部分,心跳监测部分和资源接管部分,心跳监测可以通过网络链路和串口进行,而且支持冗余链路,它们之间相互发送报文来告诉对方自己当前的状态,如果在指定的时间内未收到对方发送的报文,那么就认为对方失效,这时需启动资源接管模块来接管运行在对方主机上的资源或者服务。

1.4、heartbeat的相关术语

1)node(节点)- 运行heartbeat进程的一个独立主机,称为节点,节点是HA的核心组成部分。

- 节点有主次之分

- 有唯一的主机名

- 有属于自己的资源

- 主节点运行一个或多个应用服务,而备用节点一般处于监控状态。

2)resource(资源)- 资源是节点可以控制的实体,当故障发生时这些资源能够被其他节点接管。

- 磁盘分区、文件系统

- IP地址

- 应用程序服务

- NFS文件系统

3)event(事件)

- 节点系统故障

- 网络连接故障

- 应用故障

- ……

4)action(动作)

事件发生时HA的响应方式(由shell script控制)

1.5、heartbeat的组成


wKiom1YeUMSDIOKnAAEujW1-Peo849.jpg

beartbeat - 节点间通讯检测模块

ha-logd - 集群事件日志服务

CCM(Consensus Cluster Membership) - 集群成员一致管理模块

LRM(Local Resource Manager) - 本地资源管理模块

Stonith Daemon - 使出现问题的节点从群集环境中脱离

CRM(Cluster Resource Management) - 群集资源管理模块

Cluster policy engine - 集群策略引擎

Cluster transition engine - 集群转移引擎

2、实践部分

2.1、主机信息

HA1:

eth0

ipaddress=10.168.0.161

vip=10.168.0.160

gateway=10.168.0.1

eth1

ipaddress=10.0.0.1

hostname=HA1


HA2:

eth0

ipaddress=10.168.0.162

vip=10.168.0.160

gateway=10.168.0.161

eth1

ipaddress=10.0.0.2

hostname=HA2


client:

ipaddress=10.168.0.8

2.2、yum源安装

In HA1&HA2

1
2
3
yum -y  install  http: //mirrors .opencas.cn /epel/6/i386/epel-release-6-8 .noarch.rpm
yum -y  install  heartbeat* libnet nginx
yum -y  install  ntp

2.3、实验步骤

2.3.1、step1

In HA1

1
2
cd  /usr/share/doc/heartbeat-3 .0.4/
cp  authkeys ha.cf haresources  /etc/ha .d/

vim编辑/etc/ha.d/authkeys

把以下内容的注释去掉(删除#)或直接加入如下内容:

1
2
auth 3
3 md5 hello!

更改文件权限

1
chmod  600  /etc/ha .d /authkeys

vim编辑/etc/ha.d/haresources加入如下内容:

1
ha1 10.168.0.160 /24/eth0  nginx

vim编辑/etc/ha.d/ha.cf,把以下内容的注释去掉(删除#)或直接加入如下内容:

1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
debugfile  /var/log/ha-debug
logfile  /var/log/ha-log
logfacility local0
keeplive 2
deadtime 30
warntime 10
initdead 60
udpport 694
ucast eth1 10.0.0.2
auto_failback on
node HA1
node HA2
ping  10.168.0.1
#respawn hacluster /usr/libheartbeat/ipfail
respawn hacluster  /usr/lib64/heartbeat/ipfail

注:

1)hostname带后缀的域名(HA1.cmdschool.org)会出报错。

2)x86与x64要分别使用14与15行

2.3.2、step2

In HA2

1
scp  10.168.0.161: /etc/ha .d/{authkeys,ha.cf,haresources}  /etc/ha .d/

vim编辑/etc/ha.d/ha.cf,修改ucast参数:

1
ucast eth1 10.0.0.1

IP修改为对端主机的IP地址(10.0.0.1)

2.3.3、step3

启动服务并配置自启动

In HA1&HA2

1
2
3
4
/etc/init .d /nginx  start
/etc/init .d /heartbeat  start
chkconfig heartbeat on
chkconfig nginx on

2.3.4、step4

开放端口

In HA1&HA2

1)vim编辑/etc/sysconfig/iptables

1
2
-A INPUT -m state --state NEW -m tcp -p tcp --dport 80 -j ACCEPT
-A INPUT -m state --state NEW -m udp -p udp --dport 694 -j ACCEPT

2)重启防火墙

1
/etc/init .d /iptables  restart

2.3.5、step5

调整时区并对时:

In HA1&HA2

1
2
cp  /usr/share/zoneinfo/Asia/Shanghai  /etc/localtime
ntpdate 0.centos.pool.ntp.org

2.3.6、step6

1)创建网站测试网站

In HA1

1
2
mkdir  -p  /var/www/www .cmdschool.org
echo  HA1 >  /var/www/www .cmdschool.org /index .html

In HA2

1
2
mkdir  -p  /var/www/www .cmdschool.org
echo  HA2 >  /var/www/www .cmdschool.org /index .html

2)检查配置文件

In HA1&HA2

1
grep  include  /etc/nginx/nginx .conf

应当包含如下语句:

1
include  /etc/nginx/conf .d/*.conf;

3)增加配置文件

In HA1&HA2

vim编辑/etc/nginx/conf.d/www.cmdschool.org.conf

1
2
3
4
5
6
7
8
9
server {
     listen       80;
     server_name  www.cmdschool.org;
 
     location / {
         root    /var/www/www .cmdschool.org;
         index  index.html index.htm;
     }
}

4)重启服务

In HA1&HA2

1
/etc/init .d /nginx  restart

5)模拟dns并测试

In client

vim编辑/etc/hosts

1
10.168.0.161 www.cmdschool.org

修改www.cmdschool.org指向10.168.0.161,并做如下测试:

1
curl http: //www .cmdschool.org

vim编辑/etc/hosts

1
10.168.0.162 www.cmdschool.org

修改www.cmdschool.org指向10.168.0.162,并做如下测试:

1
curl http: //www .cmdschool.org

5)配置虚拟IP的模拟dns指向

vim编辑/etc/hosts

1
10.168.0.160 www.cmdschool.org

修改www.cmdschool.org指向10.168.0.160,并做如下测试:

1
curl http: //www .cmdschool.org

2.3.7、step7

测试步骤

1)关闭或重启主节点heartbeat服务

In HA1

1
/etc/init .d /heartbeat  restart

In client

1
curl http: //www .cmdschool.org

注:服务无缝切换

2)关闭主节点网络

In HA1

1
ifdown eth0

In client

等待30秒后:

1
curl http: //www .cmdschool.org

注:30秒接管

3)关闭主节点电源

In HA1

1
halt

In client

等待30秒后:

1
curl http: //www .cmdschool.org

注:30秒接管

4)切断主节点的所有网络

In HA1

1
ifdown eth1

注:心跳线中断不会引起资源接管

1
ifdown eth0

In client

等待30秒后:

1
curl http: //www .cmdschool.org

注:30秒接管

5)heartbeat守护进程意外结束

1
killall -9 heartbeat

注:30秒接管(包含内核模块watchdog不出现资源争用)

watchdog模块确认方法:

1
modinfo softdog

显示如下:

1
2
3
4
5
6
7
8
9
10
11
12
filename:        /lib/modules/2 .6.32-431.el6.x86_64 /kernel/drivers/watchdog/softdog .ko
alias :          char-major-10-130
license:        GPL
description:    Software Watchdog Device Driver
author:         Alan Cox
srcversion:     47DC8C5D5D2AF6E6652F271
depends:
vermagic:       2.6.32-431.el6.x86_64 SMP mod_unload modversions
parm:           soft_margin:Watchdog soft_margin  in  seconds. (0 < soft_margin < 65536, default=60) (int)
parm:           nowayout:Watchdog cannot be stopped once started (default=0) (int)
parm:           soft_noboot:Softdog action,  set  to 1 to ignore reboots, 0 to reboot (default depends on ONLY_TESTING) (int)
parm:           soft_panic:Softdog action,  set  to 1 to panic, 0 to reboot (default=0) (int)








本文转自 tanzhenchao 51CTO博客,原文链接:http://blog.51cto.com/cmdschool/1702729,如需转载请自行联系原作者

目录
相关文章
|
16天前
|
Linux
在 Linux 系统中,“cd”命令用于切换当前工作目录
在 Linux 系统中,“cd”命令用于切换当前工作目录。本文详细介绍了“cd”命令的基本用法和常见技巧,包括使用“.”、“..”、“~”、绝对路径和相对路径,以及快速切换到上一次工作目录等。此外,还探讨了高级技巧,如使用通配符、结合其他命令、在脚本中使用,以及实际应用案例,帮助读者提高工作效率。
57 3
|
16天前
|
监控 安全 Linux
在 Linux 系统中,网络管理是重要任务。本文介绍了常用的网络命令及其适用场景
在 Linux 系统中,网络管理是重要任务。本文介绍了常用的网络命令及其适用场景,包括 ping(测试连通性)、traceroute(跟踪路由路径)、netstat(显示网络连接信息)、nmap(网络扫描)、ifconfig 和 ip(网络接口配置)。掌握这些命令有助于高效诊断和解决网络问题,保障网络稳定运行。
47 2
|
25天前
|
Linux 应用服务中间件 Shell
linux系统服务二!
本文详细介绍了Linux系统的启动流程,包括CentOS 7的具体启动步骤,从BIOS自检到加载内核、启动systemd程序等。同时,文章还对比了CentOS 6和CentOS 7的启动流程,分析了启动过程中的耗时情况。接着,文章讲解了Linux的运行级别及其管理命令,systemd的基本概念、优势及常用命令,并提供了自定义systemd启动文件的示例。最后,文章介绍了单用户模式和救援模式的使用方法,包括如何找回忘记的密码和修复启动故障。
42 5
linux系统服务二!
|
10天前
|
Ubuntu Linux 网络安全
linux系统ubuntu中在命令行中打开图形界面的文件夹
在Ubuntu系统中,通过命令行打开图形界面的文件夹是一个高效且实用的操作。无论是使用Nautilus、Dolphin还是Thunar,都可以根据具体桌面环境选择合适的文件管理器。通过上述命令和方法,可以简化日常工作,提高效率。同时,解决权限问题和图形界面问题也能确保操作的顺利进行。掌握这些技巧,可以使Linux操作更加便捷和灵活。
15 3
|
16天前
|
安全 网络协议 Linux
本文详细介绍了 Linux 系统中 ping 命令的使用方法和技巧,涵盖基本用法、高级用法、实际应用案例及注意事项。
本文详细介绍了 Linux 系统中 ping 命令的使用方法和技巧,涵盖基本用法、高级用法、实际应用案例及注意事项。通过掌握 ping 命令,读者可以轻松测试网络连通性、诊断网络问题并提升网络管理能力。
53 3
|
19天前
|
安全 Linux 数据安全/隐私保护
在 Linux 系统中,查找文件所有者是系统管理和安全审计的重要技能。
在 Linux 系统中,查找文件所有者是系统管理和安全审计的重要技能。本文介绍了使用 `ls -l` 和 `stat` 命令查找文件所有者的基本方法,以及通过文件路径、通配符和结合其他命令的高级技巧。还提供了实际案例分析和注意事项,帮助读者更好地掌握这一操作。
36 6
|
19天前
|
Linux
在 Linux 系统中,`find` 命令是一个强大的文件查找工具
在 Linux 系统中,`find` 命令是一个强大的文件查找工具。本文详细介绍了 `find` 命令的基本语法、常用选项和具体应用示例,帮助用户快速掌握如何根据文件名、类型、大小、修改时间等条件查找文件,并展示了如何结合逻辑运算符、正则表达式和排除特定目录等高级用法。
54 6
|
20天前
|
机器学习/深度学习 自然语言处理 Linux
Linux 中的机器学习:Whisper——自动语音识别系统
本文介绍了先进的自动语音识别系统 Whisper 在 Linux 环境中的应用。Whisper 基于深度学习和神经网络技术,支持多语言识别,具有高准确性和实时处理能力。文章详细讲解了在 Linux 中安装、配置和使用 Whisper 的步骤,以及其在语音助手、语音识别软件等领域的应用场景。
52 5
|
20天前
|
缓存 运维 监控
【运维必备知识】Linux系统平均负载与top、uptime命令详解
系统平均负载是衡量Linux服务器性能的关键指标之一。通过使用 `top`和 `uptime`命令,可以实时监控系统的负载情况,帮助运维人员及时发现并解决潜在问题。理解这些工具的输出和意义是确保系统稳定运行的基础。希望本文对Linux系统平均负载及相关命令的详细解析能帮助您更好地进行系统运维和性能优化。
43 3
|
20天前
|
监控 网络协议 算法
Linux内核优化:提升系统性能与稳定性的策略####
本文深入探讨了Linux操作系统内核的优化策略,旨在通过一系列技术手段和最佳实践,显著提升系统的性能、响应速度及稳定性。文章首先概述了Linux内核的核心组件及其在系统中的作用,随后详细阐述了内存管理、进程调度、文件系统优化、网络栈调整及并发控制等关键领域的优化方法。通过实际案例分析,展示了这些优化措施如何有效减少延迟、提高吞吐量,并增强系统的整体健壮性。最终,文章强调了持续监控、定期更新及合理配置对于维持Linux系统长期高效运行的重要性。 ####