开发者社区> 枫凡> 正文
阿里云
为了无法计算的价值
打开APP
阿里云APP内打开

网络问题定位问题手段总结

简介: 引言 网络问题,不像系统或者数据库问题,仅仅凭借日志,很难定位到原因;没有相关证据,只有猜测性的结果,无法有效的推动第三方协助解决为了更好的定位问题,我们需要很多的工具以及方法进行获取证据。本文对常用的工具和方法做汇总。
+关注继续查看

引言

网络问题,不像系统或者数据库问题,仅仅凭借日志,很难定位到原因;没有相关证据,只有猜测性的结果,无法有效的推动第三方协助解决;为了更好的定位问题,我们需要很多的工具以及方法进行获取证据。本文对常用的工具和方法做汇总。

连通性&丢包问题

此类问题排查方法排查手段一般有:ping&mtr&traceroute等命令;最常用的方法参考下面内容

  1. ping 丢包或不通时链路测试说明

    ping命令的最佳实践是:
    ping www.aliyun.com | awk '{ print $0"\t" strftime("%Y-%m-%d %H:%M:%S",systime()) } '
    ping -DO www.aliyun.com

    image
    image

  2. 能 ping 通但端口不通时端口可用性探测说明
  3. 手机移动端网络路由跟踪探测方式
    -----iOS-iNetTools或者Android-网络万用表
  4. 网络异常时抓包操作说明

    1. Linux循环抓包命令参考
      其中相关的参数需要跟进实际情况调整。循环抓包参考如下,请注意磁盘大小;最大抓取50个包,每个包20M,共占用1G的空间,抓tcp协议的53端口的报文。

      tcpdump -iany tcp and port 53 -C 20 -W 50 -w /tmp/cap.pcap
    2. Windows循环抓包命令参考
      https://yq.aliyun.com/articles/72277
    3. 抓包时需要客户端与服务端共同抓包。
  5. TCPing测试
    工具可以在文末下载,命令参考(更多命令

    Mac:tcpping2-master xxx$ python tcpping2.py www.aliyun.com 80
    [2019-01-20 22:57:00,320] 10.65.148.173:51267, www.aliyun.com:80, conn_time: 0.034433
    [2019-01-20 22:57:02,342] 10.65.148.173:51269, www.aliyun.com:80, conn_time: 0.019742

版权声明:本文内容由阿里云实名注册用户自发贡献,版权归原作者所有,阿里云开发者社区不拥有其著作权,亦不承担相应法律责任。具体规则请查看《阿里云开发者社区用户服务协议》和《阿里云开发者社区知识产权保护指引》。如果您发现本社区中有涉嫌抄袭的内容,填写侵权投诉表单进行举报,一经查实,本社区将立刻删除涉嫌侵权内容。

附件下载:https://developer.aliyun.com/topic/download?id=678

相关文章
如何实现全链路系统问题90%精准诊断?
DevKit系统诊断工具是鲲鹏性能分析工具的子工具之一,能够针对内存、网络、存储等常见故障和异常,提供精准定位和诊断能力,帮助用户识别出源代码中的问题点,提升程序的可靠性,故障定位准确率高达90%。
0 0
故障定位方法-磁盘故障定位手段
常见的磁盘故障是磁盘空间不足、磁盘出现坏块、磁盘未挂载等。 磁盘故障有的会导致文件系统损坏,比如磁盘未挂载,集群管理自动定期做磁盘检测时会识别故障并将实例停止,查看集群状态时对应实例状态异常;有的不会导致文件系统损坏,比如磁盘空间不足,集群管理无法检测到,服务进程访问到故障磁盘会异常退出,比如:数据库无法启动、checksum校验不对、页面读写失败、页面校验错误等。 对于会导致文件系统损坏的故障,查看集群状态会显示对应实例状态持续为Unknown,定位方法如下: 查看cm_agent日志,日志保存在mpp/omm/cm/cm_agent,日志中会有类似“data path disc wri
0 0
+关注
枫凡
专注于云计算相关的安全问题以及网络问题。坚信:“不忘初心,方得始终”
文章
问答
文章排行榜
最热
最新
相关电子书
更多
改善弱网络-探索移动互联网下弱网络处理方式
立即下载
数据泄露时代的网络边界防御实践
立即下载
数据泄露时代的 网络边界防御实践
立即下载