谈谈VIP漂移那点破事

本文涉及的产品
云防火墙,500元 1000GB
简介:

一直以来都是用nginx的upstream模块做网站最前端的负载均衡,为了防止nginx本身宕机导致网站不能访问,通常都会做两套nginx反向代理,然后用keepalive之类的软件提供VIP。


常见的环境是nginx主节点和从节点各有一个公网IP,一个私有IP,VIP地址也使用公网IP来提供,正常情况下VIP只会在nginx主节点上工作,只有主节点宕机或者网络不可达等情况下,VIP才会漂移到nginx从节点上。如果keepalive配置了非抢占模式,则主节点恢复后,VIP也不会漂移会主节点,而是继续在从节工作。这种配置要求机房网络不做mac地址绑定。


最近做的两套培训系统测试情况如下:

系统一:主从节点做双网卡绑定,都只有一个私有IP,VIP也为私有IP,通过防火墙的NAT转发用户的访问请求。主节点宕机后,VIP可以漂移至从节点,但用户无法访问网站,telnet防火墙公网IP的80端口提示无法连接。


系统二:主从节点各有两张网卡,分别配置一个公网IP和一个私有IP。VIP地址也使用公网IP来提供。

主节点宕机后,VIP可以漂移至从节点,但用户无法ping通VIP,自然网站也就打不开。


于是分别对这两种情况进行排查:

系统二:属于比较常见的配置方案。VIP漂移后无法ping通,第一反应询问机房工作人员,是否相应的设备做了mac地址绑定。得知无绑定策略后继续排查。

发现配置net.ipv4.ip_nonlocal_bind = 1 参数并使其生效后重新测试正常。


系统一:情况有点特殊,按系统二的解决方法尝试无果后,怀疑端口路由器映射上出现问题。于是继续测试VIP漂移,发现VIP漂移到从节点后,防火墙上的arp表中vip对应的mac地址依旧是主节点网卡的mac地址,原来防火墙才是罪魁祸首,坑爹的货。机房使用的防火墙型号华为Quidway Eudemon1000E,据说默认配置下,这个arp地址表自动刷新需要20分钟!


好吧!于是用下面的命名手工刷新后,万事大吉,网站访问也很顺畅,比较郁闷的是当主节点重新抢占VIP后,依然需要手工刷新下,否则防火墙还是把请求转给从节点响应。

# arping -I 网卡地址 -c 3 -s VIP地址 网关地址


后记:

要彻底解决系统一的问题,可以从两方面去着手,首先是考虑去调整防火墙的arp表的自动刷新时间;其次是考虑在从节点上部署一个无限循环的脚本,时时去检测是否抢占到了VIP,若抢占成功,则运行前面的刷新命令,命令成功运行后退出脚本,同时可以用nagios监控该脚本,了解最新的主从切换情况。切记,循环运行一次接受后sleep 1秒,否则会死机的哦!

如果在主节点上也部署类似的脚本,则会对网络带来负担,因而主节点恢复后的刷新手工运行下就好了,如果忘记运行了,从节点依然可以工作,无伤大雅!

本文转自斩月博客51CTO博客,原文链接http://blog.51cto.com/ylw6006/1314004如需转载请自行联系原作者


ylw6006

相关文章
|
机器学习/深度学习 监控
数据漂移、概念漂移以及如何监控它们(mona)
在机器学习模型监控的上下文中经常提到数据和概念漂移,但它们到底是什么以及如何检测到它们?此外,考虑到围绕它们的常见误解,是不惜一切代价避免数据和概念漂移的事情,还是在生产中训练模型的自然和可接受的后果?请仔细阅读,找出答案。在本文中,我们将提供模型漂移的细粒度细分,以及检测它们的方法以及处理它们时的最佳实践。
|
3月前
|
负载均衡 网络协议 Unix
Nginx负载均衡与故障转移实践
Nginx通过ngx_http_upstream_module模块实现负载均衡与故障转移,适用于多服务器环境。利用`upstream`与`server`指令定义后端服务器组,通过`proxy_pass`将请求代理至这些服务器,实现请求分发。Nginx还提供了多种负载均衡策略,如轮询、权重分配、IP哈希等,并支持自定义故障转移逻辑,确保系统稳定性和高可用性。示例配置展示了如何定义负载均衡设备及状态,并应用到具体server配置中。
|
7月前
|
负载均衡 算法 网络协议
【专栏】网络高可用性和负载均衡关键在于VRRP、VGMP和HRP协议
【4月更文挑战第28天】网络高可用性和负载均衡关键在于VRRP、VGMP和HRP协议。VRRP实现路由器冗余,保证流量转发;VGMP优化多播流量传输,适合多媒体服务;HRP提供无缝故障转移,适用于电信级网络。选择需考虑网络环境和业务需求,VRRP简单易部署,VGMP处理多播流量,HRP适合高稳定性场景。理解协议特点,确保网络最佳性能和可用性。
222 4
|
SQL 监控 负载均衡
群集综合LVS-DR实施
群集综合LVS-DR实施
85 0
|
网络协议 算法 网络架构
STP角色选举和ospf中router-id选举(软考网工知识点梳理)
STP角色选举和ospf中router-id选举(软考网工知识点梳理)
334 0
|
存储 负载均衡 NoSQL
keepalived学习记录:对其vip漂移过程采用gdb跟踪
keepalived学习记录:对其vip漂移过程采用gdb跟踪
286 0
|
网络协议 调度
LVS+Keepalived高可用群集(无论头上是怎样的天空,我准备着承受任何风暴)(二)
LVS+Keepalived高可用群集(无论头上是怎样的天空,我准备着承受任何风暴)(二)
156 0
LVS+Keepalived高可用群集(无论头上是怎样的天空,我准备着承受任何风暴)(二)
|
负载均衡 调度 网络架构
LVS+Keepalived高可用群集(无论头上是怎样的天空,我准备着承受任何风暴)(一)
LVS+Keepalived高可用群集(无论头上是怎样的天空,我准备着承受任何风暴)(一)
105 0
LVS+Keepalived高可用群集(无论头上是怎样的天空,我准备着承受任何风暴)(一)
|
负载均衡 网络协议 前端开发
LVS负载均衡群集—DR直接路由模式(越是不顺的时候,越要沉住气)(一)
LVS负载均衡群集—DR直接路由模式(越是不顺的时候,越要沉住气)(一)
175 0
LVS负载均衡群集—DR直接路由模式(越是不顺的时候,越要沉住气)(一)
|
负载均衡 网络协议 调度
LVS负载均衡群集—DR直接路由模式(越是不顺的时候,越要沉住气)(二)
LVS负载均衡群集—DR直接路由模式(越是不顺的时候,越要沉住气)(二)
142 0
LVS负载均衡群集—DR直接路由模式(越是不顺的时候,越要沉住气)(二)