多次收到nagios报警,说是我的nginx挂掉了,马上登录服务器查看,nginx还在运行,打开站点也很正常。并没有听到用户或者同事的反应,所以以为是误报警问题。
今天早上,突然灵光一下(主要是昨天晚上报了一晚上的警),实在是烦了,本来想要去掉这个监控,登陆上服务器后,打开配置文件,突然想到,我的监控是通过ip地址来的,那么这个check_http的监控应该会只是针对默认站点进行检查,如果默认站点挂了,其他的站点没挂,那么不就报警了吗,当然,报警了,我检查的时候没检查默认站点,而是只是检查了其他的站点。
描述:我们是通过nginx,然后到tomcat。问题出在tomcat,
错误提示:too many open files。解决方法,见另一篇文章
所以这里也有一悟,以前分不大清nginx各个功能的应用,通过这个错误有点小理解,这里应该是只是代理,把请求转向tomcat,所以错误提示出现在tomcat的日志里,而不是出在nginx的日志里。