开发者社区 > 云原生 > 云原生可观测 > 正文

阿里云Grafana是升级了什么吗?现在好像都不会报警了。应该如何排查为什么不报警呀?

阿里云Grafana是升级了什么吗?现在好像都不会报警了。应该如何排查为什么不报警呀。image.png

展开
收起
真的很搞笑 2024-01-10 11:04:17 38 0
3 条回答
写回答
取消 提交回答
  • 面对过去,不要迷离;面对未来,不必彷徨;活在今天,你只要把自己完全展示给别人看。

    阿里云的Grafana在2022年进行了多次升级,其中2月24日的一次更新中,日志服务告警系统完成了告警降噪、通知等处理。此外,为了高效分析与查看指标、日志和跟踪,阿里云还推出了可观测可视化Grafana版,这可以帮助您降低运维的复杂性和工作量。

    关于报警问题,您需要确保已经正确配置了Prometheus和Grafana来对服务器进行统一监控、规划与报警。当服务器出现宕机或异常时,Grafana应该能够迅速通过短信、钉钉、邮件等方式进行通知。如果您遇到报警问题,可以按照以下步骤进行排查:

    1. 检查Grafana的配置文件是否正确。
    2. 确保Prometheus和Grafana的版本是兼容的。
    3. 检查数据源是否正确配置。
    4. 确认报警规则是否设置正确。
    5. 确认接收报警的方式是否设置正确。
    2024-01-13 17:48:19
    赞同 展开评论 打赏
  • 阿里云Grafana的最新版本是8.0.6,并且从这个版本开始,日志服务告警系统负责处理告警降噪和通知。如果您发现Grafana不再报警,可能的原因包括:

    1. 未创建开放告警应用。请确认您已经正确配置了开放告警应用。
    2. 未正确设置告警规则或监控指标。需要用Prometheus + Grafana对服务器进行统一监控、规划与报警,并时刻关注服务器的响应情况。
    3. 服务器出现宕机或异常。在这种情况下,Grafana应通过短信、钉钉、邮件等方式及时通知您。
    4. 结合 ARMS 应用监控,如果出现问题,可以通过快速定位出错接口和慢接口、重现调用参数、发现系统瓶颈等方式大幅提升线上问题诊断的效率。
    2024-01-13 11:09:01
    赞同 展开评论 打赏
  • 定位原因: Grafana 8.2.x及7.5.x是告警主动发送,Grafana9.0.x和10.0.x告警是采用的订阅模式; Grafana 8.2.x及7.5.x告警是AlertRule主动配置发送的目标告警通道,即告警AlertRule决定要把消息发送给谁.image.png
    Grafana9.0.x和10.0.x告警是采用的订阅模式, 需要Notification Policy的通知策略来订阅;即告警AlertRule不关心发送给谁,通知策略来统一订阅告警事件并发送.image.png
    升级9.0.x后需要调整并创建下通知策略Notification Policy即可.image.png
    建议升级9.0.x后在AlertRule的Custom Labels中配置下Labels,便于在Notification Policy中根据Labels进行订阅;9.0.x相对于8.2.x的告警,优点是告警和通知策略解耦,

    当希望将告警发送到其他渠道或者其他联系人,不再需要调整所有的AlertRule,只需要调整1条通知策略即可Notification Policy可以参考上面的解释,升级版本后配置下Notification Policy订阅告警即可. ,此回答整理自钉群“「客」阿里云Grafana服务群”

    2024-01-10 12:06:49
    赞同 展开评论 打赏

云原生可观测基于Prometheus、Grafana 、OpenTelemetry 等核心产品, 形成指标、链路存储分析、异构数据源集成的数据层, 通过标准PromQL和SQL提供大盘展示、告警与探索能力。

相关产品

  • 可观测可视化 Grafana 版
  • 热门讨论

    热门文章

    相关电子书

    更多
    阿里云产品五月刊 立即下载
    阿里云云原生技术实践营 AI 原生应用架构专场·北京站 立即下载
    低代码开发师(初级)实战教程 立即下载