SLS相同监控规则太多?试试告警监控模板

本文涉及的产品
日志服务 SLS,月写入数据量 50GB 1个月
简介: 随着使用SLS监控告警服务的用户越来越多,部分用户的业务数据因为一些原因(如不同区域、数据分流、按标签分类等原因)写入了不同Logstore,而这些业务数据的字段以及信息是完全一样的,对于这种数据,用户往往想要使用同样的一套监控规则来进行监控告警。

日志服务告警是SLS提供的一站式告警监控、降噪、事务管理、通知分派的智能运维平台,能够完美地支持开发运维、IT运维、安全运维、智能运维以及商务运维等场景下监控告警的需求。

在SLS的告警运维平台上,用户如果需要对某个数据资源(如Logstore和Metricstore)进行监控时,需要在对应Project下的数据资源上创建一个监控规则,当SLS根据监控规则检测出告警后,就会根据用户选择的告警策略和行动策略进行告警通知。

告警复制 VS 告警监控模板

随着使用SLS监控告警服务的用户越来越多,部分用户的业务数据因为一些原因(如不同区域、数据分流、按标签分类等原因)写入了不同Logstore,而这些业务数据的字段以及信息是完全一样的,对于这种数据,用户往往想要使用同样的一套监控规则来进行监控告警。SLS提供的告警复制功能可以快速地将一个监控规则复制到其他的Logstore中,如下图所示,复制以后实际上是在目标Logstore上创建了一个新的监控规则,新的监控规则与原来的监控规则配置相同,各自独立地根据频率对查询分析结果进行检查。

005FD270-44AD-4392-956A-63AB72A95327.png

但是告警复制仍然存在如下限制:

  • 修改某个监控规则后只会对当前应用的Logstore生效,如果所有的Logstore都需要更新监控规则,需要对所有的监控规则逐个手动进行更新,很消耗时间并且容易出错。
  • 无法查看到使用了同样一套监控规则的Logstore列表,不能快速地调整监控规则应用的目标Logstore。
  • 无法一键删除所有的监控规则。

基于上述问题,SLS推出了自定义告警监控模板的功能。

自定义告警监控模板的实现思路如下图所示,从图中可以明显看出与告警复制的实现有很大不同。自定义监控模板会将用户事先创建的监控规则转换成一个规则模板,用户后续可以将规则模板与目标数据资源进行关联或者消关联,这样可以快速地将一个规则应用到多个数据资源上。在后期修改监控规则时,本质上修改的也是监控规则模板,因为一次更新就可以对关联了该规则模板的所有数据资源生效,并且该监控规则模板也记录了所有关联的数据资源信息,用户可以很方便地就查看到详细的关联信息。

EAAB3BFF-9C71-4300-85D1-B6D96E6345D1.png

操作步骤

步骤1 创建一个告警监控规则

具体的步骤可以参考创建日志告警监控规则

步骤2 转为模板并关联资源

在创建好的监控规则操作选项中选择转为模板

在转换的过程中就可以选择想要应用该规则的目标资源,也可以直接点击确定(默认会将转换后的监控规则模板应用到原Logstore上),后续再进行关联资源的操作。

步骤3 进行相关操作

成功转为模板后告警类别变为模板告警,并且后面支持的操作增加了关联资源删除模板两个选项。

点击关联资源后的弹窗与步骤2中转为模板时的弹窗一样,用户可以在这里面进行数据资源的关联和取消关联,通过点击查看可以快速查看关联了该监控规则模板的所有数据资源。

关联了某些资源后,可以在对应Project的告警中心查看到自动创建出来的模板告警,取消了某些资源的关联后,可以在对应Project的告警中心查看到模板告警自动被删除。

点击模板告警的编辑后,会提示用户该告警监控规则的修改实际是是修改告警监控模板,也就是会对所有相关的告警监控规则起作用。

点击模板告警的删除模板后,可以删除掉关联了该监控规则模板的所有告警监控规则(以及该模板自身)。

使用限制

  • 目前告警监控规则模板仅支持添加一条查询分析语句,对于一个监控规则中,有多个查询分析语句的情况,暂时不支持转化为告警监控模板。
  • 由于告警监控规则模板涉及一次性对多个数据源进行规则监控,当前是RAM用户时,需要确保对所有相关联的Project、数据源有配置告警监控的权限,可以参考授予RAM用户告警操作权限
相关实践学习
日志服务之使用Nginx模式采集日志
本文介绍如何通过日志服务控制台创建Nginx模式的Logtail配置快速采集Nginx日志并进行多维度分析。
目录
相关文章
|
2月前
|
运维 Prometheus 监控
监控与日志分析:运维的双剑合璧
【6月更文挑战第21天】监控与日志分析在IT运维中至关重要。监控守护系统健康,通过性能指标、服务状态和安全事件预警确保稳定性;日志分析则用于问题追踪,通过错误、访问和安全日志定位故障。监控工具如Prometheus与日志分析工具如ELK堆栈协同工作,统一平台、合理告警、定期分析和团队协作是高效运维的关键。这两者的结合助力运维人员迅速响应和解决问题,维护系统稳定。
|
3月前
|
存储 运维 监控
Kubernetes 集群监控与日志管理实践
【5月更文挑战第28天】在微服务架构日益普及的当下,容器编排工具如 Kubernetes 已成为运维工作的核心。有效的集群监控和日志管理是确保系统稳定性和服务可靠性的关键。本文将深入探讨 Kubernetes 集群的监控策略,以及如何利用现有的工具进行日志收集、存储和分析,以实现对集群健康状况的实时掌握和问题快速定位。
|
3天前
|
存储 运维 监控
监控与日志管理:保障系统稳定运行与高效运维的基石
【8月更文挑战第16天】监控与日志管理是保障系统稳定运行和高效运维的基石。它们不仅能够帮助企业及时发现并解决问题,还能够为性能调优、资源优化和业务决策提供有力支持。因此,在构建系统架构时,企业应高度重视监控与日志管理的规划和实施,确保它们能够充分发挥作用,为企业的发展保驾护航。同时,随着技术的不断进步和应用场景的不断拓展,监控与日志管理也将持续演进和创新,为企业带来更多的价值和便利。
|
3天前
|
数据采集 存储 监控
Haskell爬虫中日志记录:监控HTTP请求与响应
Haskell爬虫中日志记录:监控HTTP请求与响应
|
2月前
|
监控 Go
go语言并发实战——日志收集系统(八) go语言操作etcd以及利用watch实现对键值的监控
go语言并发实战——日志收集系统(八) go语言操作etcd以及利用watch实现对键值的监控
go语言并发实战——日志收集系统(八) go语言操作etcd以及利用watch实现对键值的监控
|
1月前
|
监控
监控治理问题之想规范化异常抛出和日志使用以降低CDO报警噪音,如何解决
监控治理问题之想规范化异常抛出和日志使用以降低CDO报警噪音,如何解决
|
2月前
|
运维 Serverless API
Serverless 应用引擎产品使用合集之sls日志告警调用函数计算,出现抛出的结果异常,是什么原因
阿里云Serverless 应用引擎(SAE)提供了完整的微服务应用生命周期管理能力,包括应用部署、服务治理、开发运维、资源管理等功能,并通过扩展功能支持多环境管理、API Gateway、事件驱动等高级应用场景,帮助企业快速构建、部署、运维和扩展微服务架构,实现Serverless化的应用部署与运维模式。以下是对SAE产品使用合集的概述,包括应用管理、服务治理、开发运维、资源管理等方面。
|
1月前
|
Prometheus 监控 Cloud Native
Java中的日志管理与监控技术选型
Java中的日志管理与监控技术选型
|
1月前
|
消息中间件 NoSQL Kafka
基于Kafka的nginx日志收集分析与监控平台(3)
基于Kafka的nginx日志收集分析与监控平台(3)
|
1月前
|
消息中间件 监控 Kafka
基于Kafka的nginx日志收集分析与监控平台(2)
基于Kafka的nginx日志收集分析与监控平台(2)

热门文章

最新文章