烂泥:记一次诡异的网络中断

简介:

本文首发于烂泥行天下

本来这篇文章早就改写了,但是因为各种原因一直拖着没有写。今天刚好周五,把这篇文章写下。

最近一段时间,同事反映每天下午6:00到6:30公司网络会中断一次,并且一次的终端持续时间为15s左右。而后自动网络恢复正常。

既然同事都说了,那咱就找找问题的原因。

既然是网络终端,而且是很有规律性的。每天下午的都会有这中情况,首先怀疑是不是运营商那边进行了路由策略的调整在这时间段。

于是就联系运行商那边的客户经理,让他们查询是不是他们在这段时间内进行了相关的调整。

等了两天终于反馈,说没有进行调整。不得不说,此运营商的办事效率,唉,不提了。

继续找问题,既然不是运营商那边的问题。那就很有可能问题出在公司内部了。

登录飞鱼星路由器查看运行正常,那么说明设备运行正常。查看二层交换机也是运行正常的。

既然设备运行正常,那么就看看公司内网是不是有ARP攻击,使用相关的软件也没有看到。

很是纠结,设备没有问题,网络却有中断。

继续想问题出在的地方,问题还是回到了网络中断的地方。既然是每天这个时间中断,那我就在机器上做个计划任务。每天这个时间段ping公司的网关。

在linux主机上设定计划任务crontab 0-30 18 * * * ping baidu.com >>/tmp/ping.txt

然后第二天,观察ping的结果。经过几天的观察发现,这样的效果很不明显。因为没有发现ping不通外网的情况。但是同事反馈问题还是依旧存在。

这个可让我恼火了,问题的原因没有找到。但是问题依旧存在。此时怀疑是不是飞鱼星路由器由于长时间运行,出现负载过重等情况,于是定时在每天早上5:00进行自动重启。

就在这个问题出现后的半个月一天上午,大家都正在办公时,公司网络再次出现中断。此时登录路由器,打算再次重启时,发现路由器的运行时间是3分钟

“3分钟”,想一想不对,我定时重启路由器是在每天早上5:00点,而公司上班的时间为9:30。那么按照正常计算的话,路由器的运行时间应该是4.5小时。而不是3分钟。

但是正常情况下,该路由器从启动到正常运行的时间应该是2分钟左右。按照这样计算的话,公司的网络中断应该是2分钟左右而不是15s左右。

此时怀疑是不是路由器的硬件出问题,而后直接电话飞鱼星的技术支持。

把这边的情况与自己的判断和那边的技术描述下,那边技术询问了该路由器的固件版本后。反馈很有可能是固件有问题,建议我更新最新固件。

嘿嘿,既然问题找到了,那就升级路由器的固件看看。

固件升级嘛,按照飞鱼星官方文档升级即可。

升级完毕后,再次观察,问题没有出现。

至此问题解决。

PS:由于当时,没有进行相关截图,所以此篇文章只有文字。


本文转自 烂泥行天下 51CTO博客,原文链接:http://blog.51cto.com/ilanni/1419841

相关文章
|
6月前
|
安全 测试技术 网络架构
澳大利亚电信由断电引发的大规模网络中断给CIO带来的惨痛教训
澳大利亚电信由断电引发的大规模网络中断给CIO带来的惨痛教训
|
5月前
|
测试技术 API Android开发
autox.js如何监听异常情况,比如网络中断、内存慢、应用死机或者页面无响应
autox.js如何监听异常情况,比如网络中断、内存慢、应用死机或者页面无响应
|
算法 安全 Linux
高性能网络 SIG 月度动态:推动 virtio 支持动态中断调节及更灵活的分流机制
高性能网络 SIG 月度动态送达,一键了解 8 月各项目进展。