SLS新版本告警入门——告警管理概述

本文涉及的产品
对象存储 OSS,20GB 3个月
阿里云盘企业版 CDE,企业版用户数5人 500GB空间
云备份 Cloud Backup,100GB 3个月
简介: 日志服务支持为查询或分析结果设置告警。设置告警后,日志服务定期检查查询或分析结果,当检查结果满足预设条件时发送告警通知,实现实时的服务状态监控。在旧版本的告警中,告警规则以及通知的配置都很简单直观,但是也存在着一些痛点。为了解决上述种种存在的痛点,我们对SLS的告警功能进行了升级,提供了更加强大的功能。可以完美解决以上的一些痛点。

SLS旧版本告警概述

日志服务支持为查询或分析结果设置告警。设置告警后,日志服务定期检查查询或分析结果,当检查结果满足预设条件时发送告警通知,实现实时的服务状态监控。

1.png

在旧版本的告警中,告警规则以及通知的配置都很简单直观,但是也存在着一些痛点,主要如下:

  1. 通知配置无法复用。例如手机号、邮箱、Webhook或者钉钉机器人的地址、通知内容等信息。假如多个告警需要发给相同的人,发送相同的通知内容,就需要将用户联系方式以及通知内容配置多次,带来了很多额外的配置负担。
  2. 通知功能相对较弱,不支持动态的通知策略。例如:
  1. 多人值班
  2. 根据是否工作时间选择不同的通知渠道或者通知给不同的人
  3. 根据告警本身属性(例如严重度等)通知到不同的人
  1. 容易产生告警风暴。例如某个服务接口挂掉,那么所有依赖该服务的其它服务都可能报错触发告警,此时就会产生大量的通知,但是无法进行聚合和过滤。
  2. 缺少一些更高级、更灵活的编排功能。
  3. 等等…

SLS新版本告警概述

为了解决上述种种存在的痛点,我们对SLS的告警功能进行了升级,提供了更加强大的功能。可以完美解决以上的一些痛点。例如:

  1. 高级、灵活的编排机制(告警策略
  1. 告警路由合并:避免告警风暴
  2. 告警抑制:处理告警之间的互相影响
  3. 告警静默:预期内告警可以不发通知
  1. 通知基础资源管理
  1. 用户管理:手机号、邮箱的复用
  2. 用户组管理:管理一组用户
  3. 值班组管理:提供动态灵活的值班机制
  4. 日历管理:支持工作时间配置以及国际化时区
  5. 内容模板管理:可以复用通知内容
  1. 通知管理(行动策略
  1. 通过什么渠道:短信、电话、邮件、钉钉、Webhook、阿里云消息中心
  2. 发送给谁:选择用户、用户组或者值班组
  3. 发送什么内容:选择内容模板
  4. 其它配置:例如发送时段(是否是工作时间)、钉钉机器人是否要@某个用户、等等


完整的介绍可以参考 什么是日志服务告警,整体的功能架构参考如下:


2.png


本文主要讲解其中告警管理和通知管理部分内容。

告警管理流程

通常来说,如果要快速了解一个事物,那么从整体上了解它的脉络和结构,然后再逐部分细化深究,会起到不错的效果。因为为了了解SLS新版本告警的处理流程,我们需要先从整体上来看一下,告警触发后,究竟经历了什么。


在这个过程中,我们只需要牢记两个东西即可:告警策略、行动策略。其它一切都是围绕着这两种策略来进行的。整体上的流程如下图所示:


3.png


简而言之,告警策略就是对告警进行编排管理,行动策略是处理如何通知的问题。这么想的话,事情就变得简单起来,也就是说,当告警出发后,需要先决定哪些告警要发,然后再决定要发给谁,最后就是用户收到了通知。


其中告警策略通过路由合并、抑制和静默机制,不仅解决了哪些告警要发送的问题,同时对它们进行了合并,从而可以达到批量发送通知的效果,避免用户同一时间收到大量的通知。而行动策略不仅解决了复用的问题,还提供了更强大的动态发送机制。


为了达到告警策略和行动策略的强大且灵活的特性,我们提供了一套可视化图的方式来进行配置,从而可以很直观地进行各种条件相关的配置。

4.png

到此为止,我们可以总结一下:

  • 告警管理的核心就是告警策略和行动策略
  • 告警策略和行动策略,都是基于可视化交互表单的方式来进行配置


关于它们的具体使用和配置,我们会在接下来的文章中进行详细的介绍。


最后,如果您还想了解更多智能运维前沿资讯,欢迎您报名参加【数智创新行·智能运维专场】。

6月25日|上海·西岸国际人工智能中心

数智创新行上海站·智能运维专场

阿里云将带来云原生智能运维解决方案,满足海量事件有效感知、高效响应,可观测数据统一分析、故障定位,以及基于AI的异常检测等需求,助力企业构建自己的运维平台,成为开发、运维人员高效可靠的助手。

扫描海报二维码或点击下方链接报名, 期待您一起开启智能运维新时代!

https://www.aliyun.com/page-source//developer/special/osssalon

lALPDiCpvQqidCTNJmnNDDU_3125_9833.png

相关实践学习
日志服务之使用Nginx模式采集日志
本文介绍如何通过日志服务控制台创建Nginx模式的Logtail配置快速采集Nginx日志并进行多维度分析。
目录
相关文章
|
3天前
|
XML Java Maven
Spring5入门到实战------16、Spring5新功能 --整合日志框架(Log4j2)
这篇文章是Spring5框架的入门到实战教程,介绍了Spring5的新功能——整合日志框架Log4j2,包括Spring5对日志框架的通用封装、如何在项目中引入Log4j2、编写Log4j2的XML配置文件,并通过测试类展示了如何使用Log4j2进行日志记录。
Spring5入门到实战------16、Spring5新功能 --整合日志框架(Log4j2)
|
2月前
|
运维 Serverless API
Serverless 应用引擎产品使用合集之sls日志告警调用函数计算,出现抛出的结果异常,是什么原因
阿里云Serverless 应用引擎(SAE)提供了完整的微服务应用生命周期管理能力,包括应用部署、服务治理、开发运维、资源管理等功能,并通过扩展功能支持多环境管理、API Gateway、事件驱动等高级应用场景,帮助企业快速构建、部署、运维和扩展微服务架构,实现Serverless化的应用部署与运维模式。以下是对SAE产品使用合集的概述,包括应用管理、服务治理、开发运维、资源管理等方面。
|
2月前
|
Java 数据库连接 数据库
Spring日志完结篇,MyBatis操作数据库(入门)
Spring日志完结篇,MyBatis操作数据库(入门)
|
2月前
|
存储 运维 Serverless
函数计算产品使用问题之日志告警不生效,一般是由于什么造成的
函数计算产品作为一种事件驱动的全托管计算服务,让用户能够专注于业务逻辑的编写,而无需关心底层服务器的管理与运维。你可以有效地利用函数计算产品来支撑各类应用场景,从简单的数据处理到复杂的业务逻辑,实现快速、高效、低成本的云上部署与运维。以下是一些关于使用函数计算产品的合集和要点,帮助你更好地理解和应用这一服务。
|
3月前
|
SQL 调度 Swift
【深入浅出】阿里自研开源搜索引擎Havenask日志查询
本次分享内容为Havenask的日志查询,文章包含了具体查询步骤和举例、实操演示,希望可以帮助大家更好的使用Havenask。
55333 0
|
3月前
|
监控 Docker 容器
Docker从入门到精通:Docker log 命令学习
了解 Docker 日志管理对容器监控至关重要。`docker logs` 命令用于查看和管理容器日志,例如,`docker logs <container_name>` 显示容器日志,`-f` 或 `--follow` 实时跟踪日志,`--tail` 显示指定行数,`--timestamps` 添加时间戳,`--since` 按日期筛选。Docker 支持多种日志驱动,如 `syslog`,可通过 `--log-driver` 配置。有效管理日志能提升应用程序的稳定性和可维护性。
125 0
|
3月前
|
机器学习/深度学习 运维 监控
用SLS配置日志关键字告警的N种方法
本文由日志关键词告警出发,介绍了使用SLS进行关键词监控告警配置,并且介绍了几种常见的配置方法,可以覆盖关键词监控的大部分场景。
247 0
用SLS配置日志关键字告警的N种方法
|
6天前
|
SQL 存储 JSON
更快更强,SLS 推出高性能 SPL 日志查询模式
从海量的日志数据中,按照各种灵活的条件进行即时查询搜索,是可观测场景下的基本需求。本文介绍了 SLS 新推出的高性能 SPL 日志查询模式,支持 Unix 风格级联管道式语法,以及各种丰富的 SQL 处理函数。同时通过计算下推、向量化计算等优化,使得 SPL 查询可以在数秒内处理亿级数据,并支持 SPL 过滤结果分布图、随机翻页等特性。
241 66
|
5天前
|
数据采集 监控 数据安全/隐私保护
掌握Selenium爬虫的日志管理:调整–log-level选项的用法
在Selenium Web数据采集时,日志管理至关重要。通过调整`–log-level`参数可优化日志详细度,如设置为`INFO`记录一般操作信息。结合代理IP、Cookie及user-agent配置,不仅能提高采集成功率,还能规避反爬机制。合理选择日志级别有助于调试与性能平衡,在复杂的数据采集任务中保持程序稳定与可控。
掌握Selenium爬虫的日志管理:调整–log-level选项的用法
|
8天前
|
Java 应用服务中间件
SpringBoot 记录 access.log 日志
SpringBoot 记录 access.log 日志
18 0
SpringBoot 记录 access.log 日志

相关产品

  • 日志服务