网络二层环路,老练的网工,都是这么排查的!

简介: 网络二层环路,老练的网工,都是这么排查的!


1

判断网络二层环路


当网络业务不可用、设备指示灯有规律的一起闪烁、登录设备出现卡顿等现象时,表明网络中可能存在二层环路。

网络中是否存在二层环路有以下几种方式进行确认:


方法一:通过查看端口流量发现环路风暴,判断环路。

 在设备上执行命令:display interface brief | include up

 通过查看发生异常流量的端口数目、流量方向等判断环路发生的具体位置和原因。

注意:该方法只能看到网络的当前流量结果,此时需要和网络的正常业务量进行比较,流量远大于正常业务流量时,才能判断可能存在二层环路。如果流量只是稍大时,或者设备部署了广播抑制,就不能判断出环路了,需要使用其他方法判断。




方法二:通过持续MAC地址漂移判断环路。

 查看MAC地址漂移前,需要确认设备是否配置了MAC地址防漂移,如果已经配置则需要去使 能该功能,或者使用其他方法判断。

 1、查看MAC地址漂移告警:使用display trapbuffer命令查看MAC地址漂移告警(告警OID 1.3.6.1.4.1.2011.5.25.160.3.7 )。

 2、查看MAC地址漂移记录:第一步执行mac-address flapping detection命令使能全局MAC地址漂移检测功能。第二步执行display mac-address flapping record命令查看MAC地址漂移的记录。

 通过查看发生MAC地址漂移的接口可以判断环路发生的具体位置和原因。

注意:只有出现持续的MAC地址漂移现象才能判断网络出现了环路。如果设备有很少的MAC地址漂移记录出现,可能是由于其他原因导致的,属于正常现象。



方法三:配置Loopback Detection功能检测环路。

 配置方法:第一步执行loopback-detect enable命令使能所有接口的环回检测功能。第二步在接口视图下执行loopback-detect packet vlan vlan-id命令配置对指定的VLAN进行环路检测,执行loopback-detect action action-type命令配置检测到环路后对接口的处理动作(所有需要进行环路检测的接口都需要配置第二步)。第三步执行display loopback-detect命令查看环路检测信息。

 通过查看接口状态可以判断环路发生的具体位置和原因。

注意:Loopback Detection需要发送大量检测报文来进行环路检测,这将会耗费一定的系统资源,请在不需要检测环路时及时关闭此功能。




2

破除网络二层环路


当确认网络中存在二层环路,环路风暴严重影响正常的业务,需要尽快回复业务时,可使用快速破环方法(又称手动破环):

第一步:明确二层网络拓扑。完整的拓扑信息是正确解决环路问题的首要条件。

第二步:使用影响最小的方法破环。

   1、端口退出成环VLAN破环。

   2、shutdown成环的端口破环。

   3、拔出成环的网线或者光纤破环。

第三步:操作完成后确认环路是否破除,业务是否恢复。


 手动破环能够快速解决环路问题,但是可能会改变原有的网络拓扑结构。原来网络中的功能,如链路备份、流量负载分担等功能会受到影响。

 此时,可以在解决环路后做进一步的二层网络优化:


场景1:部署适当的破环协议

 如果当前的环路问题是由于物理环路引入的,且没有配置破环协议,可以依据网络规划部署交换机常见的破环协议,如STP/RSTP/MSTP、RRPP、SEP、VBST、 ERPS等。


场景2:提升物理链路质量和可靠性

 如果当前环路问题是由于物理链路质量不可靠,存在破环协议报文拥塞丢失,导致协议超时的临时环路,请检查物理链路并更换网线或者光纤。如果当前问题因为带宽不足导致协议报文被丢弃,需要扩充带宽或者使用聚合链路提升链路可靠性。




3

典型环路场景














相关文章
|
4月前
|
网络协议 算法 数据库
|
14天前
|
存储 缓存 网络协议
网络丢包排查方法
网络丢包排查方法
|
20天前
|
运维 监控 网络协议
在Linux中,如何进行网络故障排查?
在Linux中,如何进行网络故障排查?
|
23天前
|
域名解析 运维 监控
网络故障排查的常用工具与方法:技术深度解析
【8月更文挑战第20天】网络故障排查是一项复杂而重要的工作,需要网络管理员具备扎实的网络知识、丰富的实践经验和灵活的问题解决能力。通过掌握常用工具和方法,遵循科学的排查流程,可以显著提高故障排查的效率和准确性。希望本文能为读者在网络故障排查方面提供有益的参考和启示。
|
20天前
|
Kubernetes 网络协议 网络安全
在K8S中,容器提供一个服务,外部访问慢,到底是容器网络问题?还是容器服务问题?这种怎么排查?
在K8S中,容器提供一个服务,外部访问慢,到底是容器网络问题?还是容器服务问题?这种怎么排查?
|
20天前
|
Kubernetes 监控 Shell
在K8S中,我们公司用户反应pod连接数非常多,希望看一下这些连接都是什么信息?什么状态?怎么排查?容器里面没有集成bash环境、网络工具,怎么处理?
在K8S中,我们公司用户反应pod连接数非常多,希望看一下这些连接都是什么信息?什么状态?怎么排查?容器里面没有集成bash环境、网络工具,怎么处理?
|
20天前
|
Kubernetes 监控 网络协议
在K8S中,如果因为网络原因导致Pod异常,该如何排查?
在K8S中,如果因为网络原因导致Pod异常,该如何排查?
|
20天前
|
监控 网络协议 Linux
在Linux中,如何排查网络连接问题?
在Linux中,如何排查网络连接问题?
|
26天前
|
运维 网络安全 网络架构
资深网工是如何发现大型网络中网络环路问题的?
资深网工是如何发现大型网络中网络环路问题的?
|
3月前
|
容器 Perl Kubernetes
深入 Kubernetes 网络:实战K8s网络故障排查与诊断策略
本文介绍了Kubernetes网络的基础知识和故障排查经验,重点讨论了私有化环境中Kubernetes网络的挑战。首先,文章阐述了Kubernetes网络模型的三大核心要素:Pod网络、Service网络和CNI,并强调了其在容器通信和服务发现中的作用。接着,通过三个具体的故障案例,展示了网络冲突、主节点DNS配置更改导致的服务中断以及容器网络抖动问题的解决过程,强调了网络规划、配置管理和人员培训的重要性。最后,提到了KubeSkoop exporter工具在监控和定位网络抖动问题中的应用。通过这些案例,读者可以深入了解Kubernetes网络的复杂性,并学习到实用的故障排查方法。
147135 19