故障检测和报警功能
故障监视代理要随时记录系统出错的情况和可能引起故障的事件,并把这些信息存储在运行日志数据库中。在采用轮询通信的系统中,管理应用程序定期访问运行日志记录,以便发现故障。为了及时检测重要的故障问题,代理也可以主动向有关管理站发送出错事件报告。另外,对出错报告的数量、频率要有适当地控制,以免加重网络负载。
故障预测功能。
对各种可以引起故障的参数建立门限值,并随时监视参数值变化,一旦超过门限值,就发送警报。例如,由于出错产生的分组碎片数超过一定值时发出警报,表示线路通信恶化,出错率上升。
故障诊断和定位功能。
即对设备和通信线路进行测试,找出故障原因和故障地点,例如可以进行下列测试。
连接测试
- 数据完整性测试
- 协议完整性测试
- 数据饱和测试
- 连接饱和测试
- 环路测试
- 功能测试
- 诊断测试
定位故障范围
全网性网络故障:可定位在故障源 出口或核心区域:
小范围网络故障:可定位在故障源 在离故障源最近的相应设备或链路:
单点性网络故障:可定位在故障源 在故障源自身:
常见的排查命令
ping
ping :判断两个网络是否可互通。
ping -n 连续ping N个包
ping -t 持续ping直到人为中断,Ctrl+break,ctrl+c
ping -l 指定每个ping报文的所携带的数据部分字节0~65500数
例如:ping -l 3000 -n 2 192.168.0.115
ARP 地址解析协议
功能:显示和修改IP地址与MAC地址的之间映射
arp -a :显示所有的ARP表项
arp -s IP MAC 在ARP中缓存添加一条记录
arp -d IP 在ARP中缓存删除一条记录
arp -g 显示所有表项
Tracert 探索两个节点的路由
tracert ip_adress
tracert -h N 设置TTL最大为N
例如:tracert -h 2 ip地址
4.route
功能:route命令是操作,维护路由表的重要工具
route print 查看路由表
route add 增加一条路由记录
例如:route add 1.1.0.0 mask 255.255.0.0 10.110.41.20 metric 5
route delete 删除一条路由记录
例如:route delete IP地址(网络目标)
route -p add 永久地增加一条路由记录(重启后不丢失NT)
例如:route -p add 1.1.0.0 mask 255.255.0.0 10.110.41.20 metric 5
netstat
该命令显示协议统计信息和当前的TCP/IP连接。
netstat -a 显示所有连接和侦听端口,服务器连接通常不显示
netstat -e 显示以太网统计
netstat -n 以数字格式显示IP地址和端口号
netstat -r 显示路由表的内容
netstat -s 显示每个协议的统计