将nginx-ingress 接入监控文件系统读写吞吐率不对谱,要怎么解决啊?

将nginx-ingress 按照这个文档 https://help.aliyun.com/document_detail/445941.html 接入到监控,为什么一些指标没有数据,而且文件系统读写吞吐率有点离谱,要怎么解决啊? lQLPJxal60y6UGDNAuvNCFywyU5pj1Qa4EwDEOiBCQBjAA_2140_747.png

展开
收起
哈喽!小陈 2022-09-05 17:40:18 211 分享 版权
阿里云 AI 助理回答

根据您提供的问题和参考的知识库资料,解决Nginx Ingress监控数据不全及文件系统读写吞吐率异常的步骤如下:

1. 检查Prometheus监控数据源

  • 检查日志解析错误

    • 首先,请登录ARMS控制台,进入“Prometheus实例”-> “大盘列表” -> “Vector Self Monitor Dashboard”,查看“日志解析错误趋势”是否有数据。这一步帮助确认是否因日志格式与解析规则不匹配导致数据缺失。
  • 调整日志解析规则

    • 如发现有日志解析错误,需进入“集成中心”->“Nginx Ingress 网关监控”->“Exporter”,编辑“日志解析规则”以符合Nginx实际的日志输出格式要求。

2. 验证Nginx Status模块配置

  • 确保Nginx已正确配置Status模块,并可通过Logtail采集其监控指标。执行命令验证访问权限,如:
    $curl http://your_nginx_server_ip/nginx_status
    

    若回显信息正常,表明Nginx Status配置无误;否则,需要确保Nginx配置并重启服务。

3. 优化机器组配置与日志收集

  • 在日志服务控制台中,检查“全栈可观测”配置,确保机器组设置正确,且日志收集规则(尤其是针对Ingress Controller的日志)与实际日志格式相匹配。若日志格式被修改,务必同步更新SLS的日志收集规则,避免数据收集异常。

4. 排查Ingress相关问题

  • 使用容器服务管理控制台的Ingress诊断功能进行故障排查。输入出现问题的服务URL发起诊断,根据诊断结果定位并解决问题。

  • 查看Ingress Controller的Pod日志,分析是否存在配置不当或网络访问问题。注意日志格式与SLS配置的一致性,以免影响日志解析和监控数据准确性。

5. 文件系统读写吞吐率异常处理

  • 对于离谱的文件系统读写吞吐率,首先应通过监控大盘或自定义查询,具体识别是读操作还是写操作异常。
  • 检查应用层面是否有异常行为,比如大量不必要的日志写入、临时文件未及时清理等。
  • 考虑到监控配置问题,复查监控配置是否正确映射了文件系统相关的性能指标,确保监控项与预期监控目标一致。
  • 如果问题持续存在,考虑增加资源限制或优化存储配置,以及进一步深入操作系统层面分析I/O调度策略或磁盘状况。

综上所述,解决监控数据缺失和读写吞吐率异常的问题,需从监控配置校验、日志解析规则调整、Nginx Status模块验证、Ingress组件故障排查以及深入分析文件系统活动几个方面综合入手。

有帮助
无帮助
AI 助理回答生成答案可能存在不准确,仅供参考
0 条回答
写回答
取消 提交回答
问答分类:
问答标签:
问答地址:

阿里云拥有国内全面的云原生产品技术以及大规模的云原生应用实践,通过全面容器化、核心技术互联网化、应用 Serverless 化三大范式,助力制造业企业高效上云,实现系统稳定、应用敏捷智能。拥抱云原生,让创新无处不在。

收录在圈子:
+ 订阅
阿里云 云原生应用平台 肩负阿里巴巴集团基础设施云化以及核心技术互联网化的重要职责,致力于打造稳定、标准、先进的云原生产品,成为云原生时代的引领者,推动行业全面想云原生的技术升级,成为阿里云新增长引擎。商业化产品包括容器、云原生中间件、函数计算等。
还有其他疑问?
咨询AI助理