遇到Error-Down,怎么办?别慌!这样处理!

简介: 遇到Error-Down,怎么办?别慌!这样处理!


简介

Error-Down机制是设备提供的一种保护机制,涉及接口、堆叠、SVF、安全等多个特性。配置上述特性的指定功能后,一旦检测到接口或者接口关联的业务存在异常,设备即关闭接口并将接口状态设为ERROR DOWN,从而防止异常进一步扩散影响到整个网络。

当接口处于ERROR DOWN状态时,其指示灯状态为常灭,接口不能正常收发报文,设备上产生ERROR-DOWN_1.3.6.1.4.1.2011.5.25.257.2.1 hwErrordown告警。

您可以通过display interface命令查看引起接口Error-Down的具体原因。

display interface查看接口Error-Down原因

<HUAWEI>displayinterface10ge1/0/1 10GE1/0/1currentstate:ERRORDOWN(link-flap)(ifindex:53) Lineprotocolcurrentstate:DOWN Description: RoutePort,TheMaximumTransmitUnitis1500,TheMaximumFrameLengthis9216 Internetprotocolprocessing:disabled IPSendingFrames'FormatisPKTFMT_ETHNT_2,Hardwareaddressis04f9-388d-e682 PortMode:AUTO,PortSplit/Aggregate:- Speed:AUTO,Loopback:NONE Duplex:FULL,Negotiation:- InputFlow-control:DISABLE,OutputFlow-control:DISABLE Mdi:-,Fec:- Lastphysicaluptime:- Lastphysicaldowntime:2019-03-2418:28:31 Currentsystemtime:2019-05-1503:07:30 Statisticslastcleared:never ……

在上述示例中,接口10GE1/0/1的Error-Down原因为link-flap,即设备检测到10GE1/0/1接口频繁振荡后,关闭了该接口并将其状态置为`ERROR DOWN(link-flap) ``。

如何配置接口触发Error-Down

CE系列交换机上能够引起接口Error-Down的原因有很多种。无论接口Error-Down是由于哪一种原因引起,均意味着设备检测到了异常。那么设备是在何时进行异常检测的呢?

  • 设备正常启动后,即开始相应的异常检测功能,例如link-flap。
  • 您配置相关特性的基本功能后,系统自动检测与该特性相关联的异常。例如与堆叠特性相关的resource-mismatch、stack-config-conflict等。
  • 您配置了独立的异常检测功能或者子功能后,系统开始检测异常。例如bpdu-protection,mac-address-flapping等。

本文以较常见的Link-flap为例,介绍在链路振荡情况下触发接口Error-Down的配置步骤。

链路振荡,即接口的物理状态频繁Up/Down。这种情况下,网络拓扑结构也在不断的变化。例如,在主备链路场景中,当主链路的接口物理状态频繁Up/Down时,业务将在主备链路之间来回切换,增加设备负担的同时还可能造成业务数据丢失。为了解决该问题,设备提供了配置链路振荡保护功能。配置该功能后,当接口的状态频繁Up/Down时,设备直接将该接口关闭,接口处于ERROR DOWN(link-flap)状态。

  • 执行命令system-view,进入系统视图。
  • 执行命令port link-flap trigger error-down,使能接口的链路振荡保护功能。缺省情况下,已使能接口的链路振荡保护功能。
  • 执行命令interface interface-type interface-number,进入接口视图。
  • 执行命令port link-flap { [ interval interval-value ] [ threshold threshold-value ] },配置接口的链路振荡时间间隔和次数。缺省情况下,接口的链路振荡时间间隔为10秒,次数为5次。
  • 执行命令commit,提交配置。

如何恢复接口Error-Down

引起接口Error-Down的原因不同,其对应的恢复措施也不同。总体来说包括以下3种:

  • 排除业务故障。故障排除后,接口自动从ERROR DOWN状态恢复,无需用户配置。
  • 手工重启接口。
  • 在检测到异常情况前,提前配置自动恢复措施。

说明:删除引起接口ERROR DOWN的功能配置无法恢复已经处于ERROR DOWN状态的接口。

上述的三种恢复措施中,第一种不需要用户配置,只支持部分Error-Down原因,例如ERROR DOWN(dual-active-fault-event)、ERROR DOWN(no-stack-link-event)等。对于其他Error-Down原因,设备提供两种措施可以将接口从ERROR DOWN状态恢复:手动恢复和自动恢复。在采用恢复措施前,建议您先排除网络中的环路,以防止接口再次进入ERROR DOWN状态。

  • 手动恢复:在接口视图下依次执行命令shutdownundo shutdown命令或者执行命令restart,重启接口。
  • 自动恢复:在系统视图下执行命令
error-down auto-recovery cause { auto-defend | bpdu-protection | crc-statistics | dual-active | fabric-link-failure | forward-engine-buffer-failed | forward-engine-interface-failed | link-flap | loopback-detect | m-lag | mac-address-flapping | no-stack-link | portsec-reachedlimit | spine-member-exceed-limit | spine-type-unsupported | stack-config-conflict | stack-member-exceed-limit | stack-packet-defensive | storm-control | transceiver-power-low } interval interval-value
  • 命令,配置处于ERROR DOWN状态的接口自动恢复为Up的延迟时间。经过用户设置的延迟时间后,处于ERROR DOWN状态的接口其状态自动恢复为Up的功能。

自动恢复对由于同一原因Error-Down的接口同时生效,避免了手工方式逐一开启多个接口时效率低,易遗漏等问题。

相关文章
为什么要使用组件库?
为什么要使用组件库?
381 0
|
存储 缓存 前端开发
localStorage容量太小? 试试它们
localStorage容量太小? 试试它们
376 0
|
11月前
|
运维 安全
|
3月前
|
Linux 虚拟化 iOS开发
Windows Server 2022 OVF (2025 年 6 月更新) - VMware 虚拟机模板
Windows Server 2022 OVF (2025 年 6 月更新) - VMware 虚拟机模板
231 6
Windows Server 2022 OVF (2025 年 6 月更新) - VMware 虚拟机模板
|
6月前
|
Web App开发 算法 网络协议
视频直播技术干货(十三):B站实时视频直播技术实践和音视频知识入门
本文讲述搭建这样一套最新流行的实时视频直播系统需要了解的背景知识以及系统的整体架构,希望对大家有帮助。
283 13
|
8月前
|
机器学习/深度学习 边缘计算 PyTorch
PyTorch团队为TorchAO引入1-8比特量化,提升ARM平台性能
PyTorch团队推出创新技术,在其低精度计算库TorchAO中引入低位运算符支持,实现1至8位精度的嵌入层权重量化及8位动态量化激活的线性运算符。该技术通过模块化设计和高效硬件利用,优化了资源受限环境下的深度学习计算,提升了计算效率并降低了资源消耗。新内核与PyTorch生态系统无缝集成,支持即时执行、编译优化及边缘计算,为开发者提供全方位性能优势。测试结果显示,多层次量化策略显著提升了计算效率,保持了模型精度。这一突破为深度学习框架优化开辟了多个研究方向,推动了人工智能在边缘计算等领域的广泛应用。
247 11
PyTorch团队为TorchAO引入1-8比特量化,提升ARM平台性能
|
9月前
|
机器学习/深度学习 算法 索引
单目标问题的烟花优化算法求解matlab仿真,对比PSO和GA
本项目使用FW烟花优化算法求解单目标问题,并在MATLAB2022A中实现仿真,对比PSO和GA的性能。核心代码展示了适应度计算、火花生成及位置约束等关键步骤。最终通过收敛曲线对比三种算法的优化效果。烟花优化算法模拟烟花爆炸过程,探索搜索空间,寻找全局最优解,适用于复杂非线性问题。PSO和GA则分别适合快速收敛和大解空间的问题。参数调整和算法特性分析显示了各自的优势与局限。
485 11
|
11月前
|
传感器 监控 安全