企业集群平台架构设计与实现haproxy篇3(二)|学习笔记

简介: 快速学习企业集群平台架构设计与实现haproxy篇3(二)

开发者学堂课程【企业集群平台架构设计与实现:lvs/haproxy/keepalived:企业集群平台架构设计与实现haproxy篇3(二)】学习笔记,与课程紧密联系,让用户快速学习知识。

课程地址:https://developer.aliyun.com/learning/course/391/detail/5015


企业集群平台架构设计与实现haproxy篇3(二)

目录:

一、使用 HAProxy 的 Web 监控平台

二、HAproxy+KeepAlivep  高可用负载均衡系统


一、使用  HAProxy  的  Web 监控平台

HAProxy 虽然实现了服务的故障转移,但是在主机或者服务出现故障的时候,并不能发出通知告知运维人员,这对于及时性要求很高的业务系统来说,是非常不便的,不过,HAProxy 似乎也考虑到了这一点,在新的版本中  HAProxy 推出了一个基于  Web  的监控平台,通过这个平台可以查看此集群系统所有后端服务器的运行状态,在后端服务或服务器出现故障时,监控页面会通过不同的颜色来展示故障信息,这在很大程度上解决了后端服务器故障报警的问题,运维人员可通过监控这个页面来第一时间发现节点故障,进而修复故障。


二、 HAproxy+KeepAlivep 高可用负载均衡系统

1、高可用  HAproxy  集群系统的拓扑结构

      1.png

在主机和备机上重新安装  haproxy,然后配置  haproxy,这个不再介绍,下面直接给出配置好的  keepalived.conf  文件内容。在haproxy-server  主机上,keepalived.conf 的内容如下:

global_defs {

notification_email {

acassen@firewall.loc

failover @firewall.loc

sysadmin@firewall.loc

}

notification_email_from Alexandre.Cassen@firewall.loc

smtp_server 192.168.200.1

smtp_connect_timeout 30

router_id HAProxy_DEVEL

}

vrrp_script check_haproxy {

script "killall -0 haproxy"    #设置探测haproxy 服务运行状态的方式,这里的“killall -O haproxy”仅仅是检测haproxy服务状态的探测命令。

interval 2

}

vrrp_instance HAProxy_HA {

state BACKUP   #在haproxy-server和backup- haproxy上均配置为BACKUP

interface eth0

virtual_router_id 180

priority 100

advert_int 2

nopreempt   #不抢占模式,只在优先级高的机器_上设置即可,优先级低的机器不设置

authentication {

auth_type PASS

auth_pass 1111

}

track_script {

check_haproxy

}

virtual_ipaddress {

192.168.66.10/24 dev eth0   #HAProxy 的对外服务IP,即VIP

}

}

最后,将  keepalived.conf  文件复制到  backup-haproxy  服务器上对应的位置,然后将  keepalived.conf  文件中 priority  值修改为90,由于配置的是不抢占模式,因此,还需要在  backup-haproxy  服务器上去掉  nopreempt  选项。

完成所有配置后,分别在  haproxy-server 和  backup-haproxy 主机上依次启动  haproxy 服务和  keepalived  服务。注意,这里一定要先启动  haproxy  服务,因为  keepalived  服务在启动的时候会自动检测  haproxy   服务是否正常,如果发现  haproxy  服务没有启动,那么主、备 keepalived 将自动进入 fault  状态。在依次启动服务后,在正常情况下  VIP地址应该运行在  haproxy-server  服务器上,通过命令“ip a” 可以查看  VIP是否已经正常加载。

简单测试:在浏览器访问http://192/168.81.233/

刷新,也能看到  tomcat1  和2的相互转换,实现了负载均衡。同理,域名换成http://img.zb.com/http://www.zb.com/也是一样。

在 192.168.81.237里打开资源

[ root@237server keepalived]# tail -f/var/log/messages

回车

在192.168.81.236上右击,选择  Clone Session,

在192.168.81.236(1)里打开资源,编辑:

[ root@localhost ~]# tail -f /var/ log/ messages

在192.168.81.236里停掉  haproxy:

[root@localhost keepalived]# /etc/ init. d/haproxy stop

Stopping haproxy :               [OK]

[ root@loca lhost keepal ived ] #

看到236里边,  Keepalived_vrrp [ 4219] : VRRP Instance(HA 1) Now in FAULT state

Keepalived进入到  FAULT state  状态,原因是VRRP Script( check_ haproxy) failed,所以就进入到  Now in FAULT  模式。

现在看192.168.81.237,也进入   FAULT state  模式。

Apr 21 21:57:36 237server Keepalived vrrp [ 2889]: VRRP_ Instance(HA 1) Now in FAULT state

在192.168.81.237 (1)里启动haproxy

[ root@237server ~]# /etc/ init. d/haproxy start

starting haproxy :            [ OK ]

[ root@237server ~]#]

再到192.168.81.237里看到,日志检测到状态正常。

VRRP Script( check_ haproxy) succeeded  

然后自动切换到Transition to MASTER STATE

再到192.168.81.237 (1)编辑

[ root@237server ~]  # ip add

看到233跑到了237上边。

实现  haproxy  的高可用。

也可切换回236主机。

相关文章
|
3天前
|
并行计算 PyTorch 算法框架/工具
融合AMD与NVIDIA GPU集群的MLOps:异构计算环境中的分布式训练架构实践
本文探讨了如何通过技术手段混合使用AMD与NVIDIA GPU集群以支持PyTorch分布式训练。面对CUDA与ROCm框架互操作性不足的问题,文章提出利用UCC和UCX等统一通信框架实现高效数据传输,并在异构Kubernetes集群中部署任务。通过解决轻度与强度异构环境下的挑战,如计算能力不平衡、内存容量差异及通信性能优化,文章展示了如何无需重构代码即可充分利用异构硬件资源。尽管存在RDMA验证不足、通信性能次优等局限性,但该方案为最大化GPU资源利用率、降低供应商锁定提供了可行路径。源代码已公开,供读者参考实践。
16 3
融合AMD与NVIDIA GPU集群的MLOps:异构计算环境中的分布式训练架构实践
|
2月前
|
Java Linux C语言
《docker基础篇:2.Docker安装》包括前提说明、Docker的基本组成、Docker平台架构图解(架构版)、安装步骤、阿里云镜像加速、永远的HelloWorld、底层原理
《docker基础篇:2.Docker安装》包括前提说明、Docker的基本组成、Docker平台架构图解(架构版)、安装步骤、阿里云镜像加速、永远的HelloWorld、底层原理
530 90
|
1月前
|
SQL 消息中间件 Kafka
Flink+Paimon+Hologres,面向未来的一体化实时湖仓平台架构设计
本文介绍了阿里云实时数仓Hologres负责人姜伟华在Flink Forward Asia 2024上的分享,涵盖实时数仓的发展历程、从实时数仓到实时湖仓的演进,以及总结。文章通过三代实时数仓架构的演变,详细解析了Lambda架构、Kafka实时数仓分层+OLAP、Hologres实时数仓分层复用等方案,并探讨了未来从实时数仓到实时湖仓的演进方向。最后,结合实际案例和Demo展示了Hologres + Flink + Paimon在实时湖仓中的应用,帮助用户根据业务需求选择合适的方案。
581 20
Flink+Paimon+Hologres,面向未来的一体化实时湖仓平台架构设计
|
11天前
|
人工智能 运维 监控
领先AI企业经验谈:探究AI分布式推理网络架构实践
当前,AI行业正处于快速发展的关键时期。继DeepSeek大放异彩之后,又一款备受瞩目的AI智能体产品Manus横空出世。Manus具备独立思考、规划和执行复杂任务的能力,其多智能体架构能够自主调用工具。在GAIA基准测试中,Manus的性能超越了OpenAI同层次的大模型,展现出卓越的技术实力。
|
20天前
|
安全 容灾 网络安全
深度用云——释放企业潜能 | 网络先行——阿里云网络卓越架构白皮书正式发布
深度用云——释放企业潜能 | 网络先行——阿里云网络卓越架构白皮书正式发布
|
21天前
|
SQL 消息中间件 Serverless
​Flink+Paimon+Hologres,面向未来的一体化实时湖仓平台架构设计
​Flink+Paimon+Hologres,面向未来的一体化实时湖仓平台架构设计
|
1天前
|
存储 SQL 并行计算
【赵渝强老师】达梦数据库MPP集群的架构
达梦数据库提供大规模并行处理(MPP)架构,以低成本实现高性能并行计算,满足海量数据存储和复杂查询需求。DM MPP采用完全对等无共享体系,消除主节点瓶颈,通过多节点并行执行提升性能。其执行流程包括主EP生成计划、分发任务、各EP并行处理及结果汇总返回。为确保高可用性,建议结合数据守护部署。
|
1月前
|
存储 SQL 监控
转转平台IM系统架构设计与实践(二):详细设计与实现
以转转IM架构为起点,介绍IM相关组件以及组件间的关系;以IM登陆和发消息的数据流转为跑道,介绍IM静态数据结构、登陆和发消息时的动态数据变化;以IM常见问题为风景,介绍保证IM实时性、可靠性、一致性的一般方案;以高可用、高并发为终点,介绍保证IM系统稳定及性能的小技巧。
41 6
|
1月前
|
弹性计算 负载均衡 安全
【上云基础系列-02】企业推荐!必学必会的上云标准架构(弹性架构)
本文介绍上云标准弹性架构,针对企业业务发展需求,推荐使用多服务器的弹性架构而非单体架构。方案包含负载均衡、NAT网关、云服务器ECS、云数据库RDS等组件,确保业务的负载分担、冗余备份及平滑扩展。通过统一公网暴露面管理和VPC网络设计,保障架构的稳定性、安全性和可扩展性。该架构适用于中小企业上云,避免性能瓶颈和迭代升级困难,支持业务持续发展。更多内容可参考下方演进说明总览。
|
18天前
|
监控 安全 Cloud Native
企业网络架构安全持续增强框架
企业网络架构安全评估与防护体系构建需采用分层防御、动态适应、主动治理的方法。通过系统化的实施框架,涵盖分层安全架构(核心、基础、边界、终端、治理层)和动态安全能力集成(持续监控、自动化响应、自适应防护)。关键步骤包括系统性风险评估、零信任网络重构、纵深防御技术选型及云原生安全集成。最终形成韧性安全架构,实现从被动防御到主动免疫的转变,确保安全投入与业务创新的平衡。

热门文章

最新文章