开发者社区 > 云原生 > 云原生可观测 > 正文

对于告警有哪些未来工作?

已解决

对于告警有哪些未来工作?

展开
收起
游客lmkkns5ck6auu 2022-08-24 10:47:25 212 0
1 条回答
写回答
取消 提交回答
  • 推荐回答

    第一,告警准确度和接手率的优化。目前还没有很好的方式能够将告警的复盘信息高效地利用起来,未来我们将尝试通过告警准确度和接手率的信息,及时调 整不合理的告警阈值,也可能会尝试多阈值的告警,比如告警在 A 到 B 范围 之内是多少等级,在 B 以上是多少等级。

    第二,多类型数据联动。比如在排查问题的时候,除了 Metrics、Trace 和 Log 之外, 还有 profiler、CPU 的火焰图等信息,而目前这些信息与可观测数据的联动较低。提升数据联动,可以提升问题排查效率。

    第三,埋点成本控制。对于外部客户而言,埋点成本直接关系到客户使用阿里云的成本。我们将定期地对自监控指标的维度、发散的维度等进行针对性的治理,并且对于无用的维度进行数据清理,将埋点成本控制在较低水平。

    以上内容摘自 《2021 阿里云可观测技术峰会演讲实录合辑(上)》 电子书,点击https://developer.aliyun.com/ebook/download/7765 可下载完整版

    2022-08-24 15:43:37
    赞同 展开评论 打赏

云原生可观测基于Prometheus、Grafana 、OpenTelemetry 等核心产品, 形成指标、链路存储分析、异构数据源集成的数据层, 通过标准PromQL和SQL提供大盘展示、告警与探索能力。

相关电子书

更多
智能告警:IT系统神经中枢 立即下载
智能运维中的异常检测和根源分析 立即下载
基于日志trace的智能故障定位系统 立即下载