故障排查:是什么 导致了客户端批量心跳超时掉线(转)

简介: 故障排查:是什么 导致了客户端批量心跳超时掉线心跳超时指的是:针对某个在线的客户端(TCP连接),ESFramework服务端在指定的时间内,没有收到来自该客户端的任何消息,则认为该客户端已经掉线。

 

故障排查:是什么 导致了客户端批量心跳超时掉线
心跳超时指的是:针对某个在线的客户端(TCP连接),ESFramework服务端在指定的时间内,没有收到来自该客户端的任何消息,则认为该客户端已经掉线。
 
为什么需要心跳机制了?因为针对某些客户端掉线(可能是因为网络断开、或客户端程序退出),服务端不能立即感受到(有的可能需要过很长的时间才能感受到),所以,需要引入心跳机制,让服务端尽可能早地发现客户端已经不在线了。关于心跳机制,更详细的介绍可以参见这里。
 
如果发生了很多客户端批量心跳超时掉线的情况,就说明服务端在过去的某段时间内,从未收到来自这些客户端的任何心跳消息。通常有3种可能性导致该情况发生:
 
1.CPU或内存使用率过高
 
在该情况发生时,观察一下服务端进程的CPU和内存是否有异常。
比如,当CPU持续在100%时,就有可能导致接收数据的操作被停止。
 
2.处理某些信息所花费的时间过长
如果服务端的信息处理模型设定的是IocpDirectly,那么依据IocpDirectly的原理,当处理某个信息所花费的时间超过了服务端设定的心跳超时的时间,服务端就会将对应的客户端误判为心跳超时掉线。
 
假设是该原因导致的心跳超时,则对应的解决方案有:
 (1)找出那些处理非常耗时的信息,进行优化理,加快处理速度。
 (2)将超时时间间隔设定位一个更大的值或关闭心跳检测。
 (3)将信息处理修改为异步模式。
 (4)将服务端信息处理模型修改为TaskQueue模式,这样就完全避免了由于信息处理时间过长导致误判的情况。
 很显然,方案(1)是最好的也是根本性的解决方案。
 
3.服务器网络拓扑结构、防火墙、路由器、网络安全监控等相关软硬件
如果排除了前面的可能性(比如,即使改成了TaskQueue模式,批量掉线仍然发生),那么,几乎就只剩下一个可能:服务端在心跳超时时间间隔内未收到来自这些客户端的任何消息。很可能来自客户端的消息被防火墙、路由器、或某些网络完全监控的相关软硬件给挡住了。
 
此时,需要专业的运维人员或网管人员参与进来,协助排查问题,比如:
 (1)在服务器上执行netstat命令,查看目标端口的相关状态信息。
 (2)在服务器上执行抓包工具,监测目标端口上是否有数据从客户端过来。
 (3)分析服务器的网络拓扑结构,并以服务器为中心,依次向外检查防火墙、路由器、网络安全监控等相关软硬件等的设定,并进行针对性的排查测试。
 
经过以上的排查分析,应该都可以找到问题的根源所在,如果还是没有结果,可以给我留言,我们一起讨论下啊。  

http://www.cnblogs.com/zhuweisky/p/4401435.html

 

相关文章
|
XML Java API
使用 XDocReport 将 .docx 文件转换为 .pdf 文件
本文介绍如何使用 XDocReport 库在 Java 中将 Word 文件转换为 PDF 文件
5937 0
|
机器学习/深度学习
神经网络与深度学习---验证集(测试集)准确率高于训练集准确率的原因
神经网络与深度学习---验证集(测试集)准确率高于训练集准确率的原因
4396 2
|
开发工具
uniapp, 短剧视频类App实现参考,支持滑动播放,仿抖音 仿陌陌 短视频 无限滑动播放 视频流
阿里云点播服务web播放器sdk,短剧视频类App实现参考。仿抖音 仿陌陌 短视频 无限滑动播放 视频流。无uniapp video 原生组件的层级、遮挡、覆盖问题,适合与不同功能视图组合使用,实现丰富的应用功能。
uniapp, 短剧视频类App实现参考,支持滑动播放,仿抖音 仿陌陌 短视频 无限滑动播放 视频流
|
网络协议 安全 数据安全/隐私保护
Socks5代理和HTTP代理的区别在哪里?
Socks5和HTTP代理是两种IP代理方式,分别基于Socks5及HTTP协议。Socks5支持TCP/UDP,适合P2P、游戏和流媒体,提供传输层身份验证。HTTP代理仅支持HTTP,适用于Web浏览控制和内容过滤。选择代理应根据实际需求,如需高速低延迟选Socks5,需访问控制选HTTP。
|
存储 Unix 程序员
非常详细!操作系统基础【文件系统实现】
非常详细!操作系统基础【文件系统实现】
|
Java Android开发 C++
Android源代码定制:MK文件执行顺序|属性覆盖
Android源代码定制:MK文件执行顺序|属性覆盖
1309 2
Android源代码定制:MK文件执行顺序|属性覆盖
|
消息中间件 算法 Java
金石推荐 |【算法数据结构专题】「延时队列算法」史上手把手教你针对层级时间轮(TimingWheel)实现延时队列的开发实战落地(上)
金石推荐 |【算法数据结构专题】「延时队列算法」史上手把手教你针对层级时间轮(TimingWheel)实现延时队列的开发实战落地(上)
260 1
|
缓存 Java
Servlet 简介
Servlet 简介
|
监控 前端开发 安全
zabbix5.0部署(超级详细)
系统环境:CentOS-7-x86_64-Minimal-1708
656 1
zabbix5.0部署(超级详细)
|
网络安全 数据安全/隐私保护 Windows
Windows下安装Memcached
Windows下安装Memcached,实验演示
1032 3
Windows下安装Memcached