WGCLOUD监控平台在运行中,发现主机下线了,查看agent日志,发现以下错误日志
[wgcloud-agent]2022/07/01 00:12:46 WgcloudAgent.go:287: 防篡改校验错误次数大于10次,不再上报数据: 36
[wgcloud-agent]2022/07/01 00:13:46 WgcloudAgent.go:287: 防篡改校验错误次数大于10次,不再上报数据: 36
[wgcloud-agent]2022/07/01 00:14:46 WgcloudAgent.go:287: 防篡改校验错误次数大于10次,不再上报数据: 36
[wgcloud-agent]2022/07/01 00:15:46 WgcloudAgent.go:287: 防篡改校验错误次数大于10次,不再上报数据: 36
[wgcloud-agent]2022/07/01 00:16:46 WgcloudAgent.go:287: 防篡改校验错误次数大于10次,不再上报数据: 36
[wgcloud-agent]2022/07/01 00:17:20 WgcloudAgent.go:287: 防篡改校验错误次数大于10次,不再上报数据: 36
[wgcloud-agent]2022/07/01 00:17:46 WgcloudAgent.go:287: 防篡改校验错误次数大于10次,不再上报数据: 36
[wgcloud-agent]2022/07/01 00:17:46 WgcloudAgent.go:287: 防篡改校验错误次数大于10次,不再上报数据: 36
[wgcloud-agent]2022/07/01 00:18:46 WgcloudAgent.go:287: 防篡改校验错误次数大于10次,不再上报数据: 36
这个问题注意几点:
(1) server和agent的主机系统时间差不能大于15个小时,若时间差不超过15小时打印【防篡改校验错误】类似信息,忽略即可
(2) v3.3.5之前版本,server主机的9997端口(这是守护进程wgcloud-daemon-release的默认端口)要开放给agent主机,保证agent主机可以telnet通server的9997端口
v3.3.5或以后版本9997端口已经不需要开放给agent访问
(3) 若是v3.3.5或之后版本,查看server本机是否能正常访问http://localhost:9997获得返回值,如:2faa233a1400201bedc199fe1d8ab393,若server主机的localhost不能使用,可以在配置文件server/config/application.yml,将配置项daemonUrl: http://localhost:9997 中的localhost改成server主机ip
(4) wgcloud-server-release.jar不要编辑修改,若编辑过,还原回去原始安装包里的wgcloud-server-release.jar即可
(5) server和agent要保持同一个版本号
(6) server端的守护进程(wgcloud-daemon-release)不要关闭,特别是Windows注意不要关闭守护进程窗口。若是Linux,查看此进程是否存活(ps -ef | grep wgcloud)
还有一种可能是server部署在Windows,不小心左键点击守护进程的窗口,进入编辑模式了,右击恢复就好了
如果因为此原因的话,重启server(守护进程会随着server启动)后,1小时内所有agent会陆续恢复上线,也可以手动重启agent(立即上线)
(7) server如果运行在arm、龙芯等系统,需要将守护进程wgcloud-agent-release替换为对应的版本,点击下载
(8) 如果server长时间没有运行,那么当server重新启动后,agent会在1小时内陆续自动恢复上线,不用重启agent。也可以手动重启agent,会立刻恢复上线