网络故障排查与管理

简介: 故障监视就是要尽快地发现故障,找出故障原因,以便及时采取补救措施。在复杂的系统中,发现和诊断故障是不容易的。首先是有些故障很难观察到,例如分布处理中出现的死锁就很难发现。其次是有些故障现象不足以表明故障原因,例如发现远程节点没有响应,但是否低层通信协议失效不得而知。更有些故障现象具有不确定性和不一致性,引起故障的原因很多,使得故障定位复杂化。例如,终端死机、线路中断、网络拥塞或主机故障都会引起同样的故障现象,到底问题出在哪儿,需要复杂的故障定位手段。故障管理可分为如下三个功能模块。

故障检测和报警功能

故障监视代理要随时记录系统出错的情况和可能引起故障的事件,并把这些信息存储在运行日志数据库中。在采用轮询通信的系统中,管理应用程序定期访问运行日志记录,以便发现故障。为了及时检测重要的故障问题,代理也可以主动向有关管理站发送出错事件报告。另外,对出错报告的数量、频率要有适当地控制,以免加重网络负载。


故障预测功能。

对各种可以引起故障的参数建立门限值,并随时监视参数值变化,一旦超过门限值,就发送警报。例如,由于出错产生的分组碎片数超过一定值时发出警报,表示线路通信恶化,出错率上升。


故障诊断和定位功能。

即对设备和通信线路进行测试,找出故障原因和故障地点,例如可以进行下列测试。

连接测试

  • 数据完整性测试
  • 协议完整性测试
  • 数据饱和测试
  • 连接饱和测试
  • 环路测试
  • 功能测试
  • 诊断测试

定位故障范围

全网性网络故障:可定位在故障源 出口或核心区域:

小范围网络故障:可定位在故障源 在离故障源最近的相应设备或链路:

单点性网络故障:可定位在故障源 在故障源自身:

常见的排查命令

ping

ping :判断两个网络是否可互通。

ping -n 连续ping N个包

ping -t 持续ping直到人为中断,Ctrl+break,ctrl+c

ping -l 指定每个ping报文的所携带的数据部分字节0~65500数

例如:ping -l 3000 -n 2 192.168.0.115

ARP 地址解析协议

功能:显示和修改IP地址与MAC地址的之间映射

arp -a :显示所有的ARP表项

arp -s IP MAC 在ARP中缓存添加一条记录

arp -d IP 在ARP中缓存删除一条记录

arp -g 显示所有表项

Tracert 探索两个节点的路由

tracert ip_adress

tracert -h N 设置TTL最大为N

例如:tracert -h 2 ip地址

4.route

功能:route命令是操作,维护路由表的重要工具

route print 查看路由表

route add 增加一条路由记录

例如:route add 1.1.0.0 mask 255.255.0.0 10.110.41.20 metric 5

route delete 删除一条路由记录

例如:route delete IP地址(网络目标)

route -p add 永久地增加一条路由记录(重启后不丢失NT)

例如:route -p add 1.1.0.0 mask 255.255.0.0 10.110.41.20 metric 5

netstat

该命令显示协议统计信息和当前的TCP/IP连接。

netstat -a 显示所有连接和侦听端口,服务器连接通常不显示

netstat -e 显示以太网统计

netstat -n 以数字格式显示IP地址和端口号

netstat -r 显示路由表的内容

netstat -s 显示每个协议的统计

目录
相关文章
|
1月前
|
域名解析 运维 网络协议
网络诊断指南:网络故障排查步骤与技巧
网络诊断指南:网络故障排查步骤与技巧
202 7
|
2月前
|
网络协议 Linux
使用nmcli命令设置IP地址并排查网络故障
nmcli 是一个功能强大的网络管理工具,通过它可以轻松配置IP地址、网关和DNS,同时也能快速排查网络故障。通过正确使用nmcli命令,可以确保网络配置的准确性和稳定性,提高系统管理的效率。希望本文提供的详细步骤和示例能够帮助您更好地掌握nmcli的使用方法,并有效解决实际工作中的网络问题。
120 2
|
5月前
|
存储 缓存 网络协议
网络丢包排查方法
网络丢包排查方法
|
5月前
|
运维 监控 网络协议
在Linux中,如何进行网络故障排查?
在Linux中,如何进行网络故障排查?
|
5月前
|
域名解析 运维 监控
网络故障排查的常用工具与方法:技术深度解析
【8月更文挑战第20天】网络故障排查是一项复杂而重要的工作,需要网络管理员具备扎实的网络知识、丰富的实践经验和灵活的问题解决能力。通过掌握常用工具和方法,遵循科学的排查流程,可以显著提高故障排查的效率和准确性。希望本文能为读者在网络故障排查方面提供有益的参考和启示。
|
6月前
|
Kubernetes 关系型数据库 MySQL
网络基本管理
网络基本管理
48 6
|
5月前
|
Kubernetes 网络协议 网络安全
在K8S中,容器提供一个服务,外部访问慢,到底是容器网络问题?还是容器服务问题?这种怎么排查?
在K8S中,容器提供一个服务,外部访问慢,到底是容器网络问题?还是容器服务问题?这种怎么排查?
|
5月前
|
Kubernetes 监控 Shell
在K8S中,我们公司用户反应pod连接数非常多,希望看一下这些连接都是什么信息?什么状态?怎么排查?容器里面没有集成bash环境、网络工具,怎么处理?
在K8S中,我们公司用户反应pod连接数非常多,希望看一下这些连接都是什么信息?什么状态?怎么排查?容器里面没有集成bash环境、网络工具,怎么处理?
|
5月前
|
Kubernetes 监控 网络协议
在K8S中,如果因为网络原因导致Pod异常,该如何排查?
在K8S中,如果因为网络原因导致Pod异常,该如何排查?
|
5月前
|
监控 网络协议 Linux
在Linux中,如何排查网络连接问题?
在Linux中,如何排查网络连接问题?

热门文章

最新文章