SLS新版本告警入门——告警策略_抑制和静默

本文涉及的产品
对象存储 OSS,20GB 3个月
文件存储 NAS,50GB 3个月
云备份 Cloud Backup,100GB 3个月
简介: 在告警管理的过程中,除了通过路由合并来进行降噪,减少通知次数之外,还有一些更加高级的场景,例如需要暂时不发送通知。这就是告警抑制和告警静默所提供的功能。

概述

在告警管理的过程中,除了通过路由合并来进行降噪,减少通知次数之外,还有一些更加高级的场景,例如需要暂时不发送通知。这就是告警抑制和告警静默所提供的功能。

告警静默

告警静默用来阻止一段时间内符合特定规则的告警发出通知。例如某个时间段内,某个测试集群在维护,会产生一些预期内的告警,此时因为这些告警是在预期之内的,因此没有通知的必要,那么就可以通过配置静默规则来阻止通知的发送。


例如:

  • 符合特定规则:告警标签 env 的值为 test
  • 一段时间:2021-06-22 00:00:00 ~ 2021-06-22 12:00:00


那么配置参考为:

1.png

当然,也可以进行反向配置,例如配置只接受满足条件的告警,对于其它不符合条件的告警都不通知。继续上面的例子,假如这段时间内我们只接收标签 env 为 prod 的告警,对于其它环境的告警都不接收通知,那么可以配置为:

2.png

告警抑制

告警抑制与告警静默比较类似,最终效果也是不发送某些告警通知。与静默相比,抑制是一个动态的作用,表示的是告警之间的相互影响。例如某个集群网络故障可能导致大量的服务调用错误,此时根本原因是网络故障,因此可以暂时忽略服务调用错误,只接收网络故障的告警通知,从而可以只收到最根本的错误原因,有利于快速定位和恢复。或者当产生了严重的告警的时候,可以暂时不接收低级别的故障,避免被打扰到。


由于抑制表示的是告警之间的相互影响,因此抑制是具有动态时效性的。也就是说,产生抑制的告警,一旦恢复了,那么这个抑制的作用也就消失了。因此,抑制作用的时间,其实是和产生抑制的告警的生命周期相对应的。


例如我们配置高严重度的告警抑制低级别的告警,那么可以配置如下:

3.png

另外需要注意的是,抑制的生效前提是,两个告警要处于同一个合并集合内。例如下面的示例:

4.png

抑制和静默的关系

从本质上来说,抑制其实是产生了一条动态的静默规则,最终的效果都是在通知发送之前,根据静默规则(静态的静默规则以及抑制产生的动态静默规则)进行过滤,然后只发送过滤后的告警通知。


最后,如果您还想了解更多智能运维前沿资讯,欢迎您报名参加【数智创新行·智能运维专场】。

6月25日|上海·西岸国际人工智能中心

数智创新行上海站·智能运维专场

阿里云将带来云原生智能运维解决方案,满足海量事件有效感知、高效响应,可观测数据统一分析、故障定位,以及基于AI的异常检测等需求,助力企业构建自己的运维平台,成为开发、运维人员高效可靠的助手。

扫描海报二维码或点击下方链接报名, 期待您一起开启智能运维新时代!

https://www.aliyun.com/page-source//developer/special/osssalon

20210625_智能运维专场.png

相关实践学习
日志服务之使用Nginx模式采集日志
本文介绍如何通过日志服务控制台创建Nginx模式的Logtail配置快速采集Nginx日志并进行多维度分析。
目录
相关文章
|
9天前
|
Java 中间件
SpringBoot入门(6)- 添加Logback日志
SpringBoot入门(6)- 添加Logback日志
44 5
|
8天前
|
Oracle 关系型数据库 数据库
【赵渝强老师】Oracle的参数文件与告警日志文件
本文介绍了Oracle数据库的参数文件和告警日志文件。参数文件分为初始化参数文件(PFile)和服务器端参数文件(SPFile),在数据库启动时读取并分配资源。告警日志文件记录了数据库的重要活动、错误和警告信息,帮助诊断问题。文中还提供了相关视频讲解和示例代码。
|
3月前
|
Java Shell Linux
【Linux入门技巧】新员工必看:用Shell脚本轻松解析应用服务日志
关于如何使用Shell脚本来解析Linux系统中的应用服务日志,提供了脚本实现的详细步骤和技巧,以及一些Shell编程的技能扩展。
55 0
【Linux入门技巧】新员工必看:用Shell脚本轻松解析应用服务日志
|
3月前
|
XML Java Maven
Spring5入门到实战------16、Spring5新功能 --整合日志框架(Log4j2)
这篇文章是Spring5框架的入门到实战教程,介绍了Spring5的新功能——整合日志框架Log4j2,包括Spring5对日志框架的通用封装、如何在项目中引入Log4j2、编写Log4j2的XML配置文件,并通过测试类展示了如何使用Log4j2进行日志记录。
Spring5入门到实战------16、Spring5新功能 --整合日志框架(Log4j2)
|
3月前
|
SQL 关系型数据库 MySQL
MySQL 常见日志清理策略
MySQL 数据库服务器使用多种类型的日志来记录操作和事件,这对于故障诊断、审计和性能分析非常重要。然而,这些日志文件会随着时间的推移而不断增长,可能会占用大量的磁盘空间。因此,定期清理这些日志是必要的,本篇文章我们一起来学习下如何清理 MySQL 中的日志文件。
185 3
|
3月前
|
数据库 Java 监控
Struts 2 日志管理化身神秘魔法师,洞察应用运行乾坤,演绎奇幻篇章!
【8月更文挑战第31天】在软件开发中,了解应用运行状况至关重要。日志管理作为 Struts 2 应用的关键组件,记录着每个动作和决策,如同监控摄像头,帮助我们迅速定位问题、分析性能和使用情况,为优化提供依据。Struts 2 支持多种日志框架(如 Log4j、Logback),便于配置日志级别、格式和输出位置。通过在 Action 类中添加日志记录,我们能在开发过程中获取详细信息,及时发现并解决问题。合理配置日志不仅有助于调试,还能分析用户行为,提升应用性能和稳定性。
57 0
|
3月前
|
SQL 安全 测试技术
【数据守护者必备】SQL数据备份与恢复策略全解析:从全量到日志备份,手把手教你确保企业信息万无一失的实战技巧!
【8月更文挑战第31天】数据库是企业核心业务数据的基石,为防止硬件故障、软件错误或人为失误导致的数据丢失,制定可靠的备份与恢复策略至关重要。本文通过一个在线购物平台的案例,详细介绍了使用 SQL Server 进行全量备份、差异备份及事务日志备份的方法,并演示了如何利用 SQL Server Agent 实现自动化备份任务。此外,还提供了数据恢复的具体步骤和测试建议,确保数据安全与业务连续性。
145 0
|
4月前
|
弹性计算 Prometheus Cloud Native
SLS Prometheus存储问题之Union MetricStore在性能测试中是如何设置测试环境的
SLS Prometheus存储问题之Union MetricStore在性能测试中是如何设置测试环境的
|
3月前
|
消息中间件 API C#
【Azure API 管理】APIM添加Log-to-eventhub的策略后,一些相关APIM与Event Hub的问题
【Azure API 管理】APIM添加Log-to-eventhub的策略后,一些相关APIM与Event Hub的问题
|
3月前
|
存储 API C#
【Azure API 管理】在APIM 中添加 log-to-eventhub 策略,把 Request Body 信息全部记录在Event Hub中
【Azure API 管理】在APIM 中添加 log-to-eventhub 策略,把 Request Body 信息全部记录在Event Hub中

相关产品

  • 日志服务