SLS相同监控规则太多?试试告警监控模板

本文涉及的产品
日志服务 SLS,月写入数据量 50GB 1个月
简介: 本文主要介绍了SLS自定义告警监控模板的使用场景以及最佳实践。

本文主要介绍了SLS自定义告警监控模板的使用场景以及最佳实践。

目标读者

数字化系统开发运维(DevOps)工程师、稳定性工程师(SRE)、可观测平台运维人员以及有告警监控需求的开发人员等。

背景信息

日志服务告警是SLS提供的一站式告警监控、降噪、事务管理、通知分派的智能运维平台,能够完美地支持开发运维、IT运维、安全运维、智能运维以及商务运维等场景下监控告警的需求。

SLS告警功能框架图

在SLS的智能告警平台上,用户如果需要对某个数据资源(如Logstore和Metricstore)进行监控时,需要在对应Project下的数据资源上创建一个监控规则,当SLS根据监控规则检测出告警后,就会根据用户选择的告警策略和行动策略进行告警通知。

场景介绍

用户的业务数据因为一些原因写入了不同Logstore,对于这些Logstore,用户想要使用同样的一套监控规则。使用告警复制功能可以快速地将同一个监控规则复制到其他的Logstore中,但是告警复制仍存在如下限制:

  • 修改某个监控规则后只会对当前应用的Logstore生效,如果所有的Logstore都需要更新监控规则,需要对所有的监控规则逐个手动进行更新,很消耗时间并且容易出错。

  • 无法查看到使用了同样一套监控规则的Logstore列表,不能快速地调整监控规则应用的目标Logstore。

  • 无法一键删除所有的监控规则。

基于上述问题,SLS推出了自定义告警监控模板的功能。

方案架构

用户自定义告警监控模板的实现思路如下图所示,从图中可以明显看出与告警复制的实现有很大不同。自定义监控模板会将用户事先创建的监控规则转换成一个规则模板,用户后续可以将规则模板与目标数据资源进行关联或者取消关联,这样可以快速地将一个规则应用到多个数据资源上。

告警自定义模板架构图

在后期修改监控规则时,本质上修改的也是监控规则模板,因为一次更新就可以对关联了该规则模板的所有数据资源生效,并且该监控规则模板也记录了所有关联的数据资源信息,用户可以很方便地就查看到详细的关联信息。

操作步骤

步骤1 创建一个告警监控规则

具体的步骤可以参考创建日志告警监控规则

image.png

步骤2 转为模板并关联资源

在创建好的监控规则操作选项中选择转为模板

image.png

在转换的过程中就可以选择想要应用该规则的目标资源,也可以直接点击确定(默认会把转换后的监控规则模板应用到原Logstore上),后续再进行关联资源的操作。

image.png

步骤3 进行相关操作

成功转为模板后告警类别变为模板告警,并且后面支持的操作增加了关联资源删除模板两个选项。

image.png

点击关联资源后的弹窗与步骤2中转为模板时的弹窗一样,用户可以在这里面进行数据资源的关联和取消关联,通过点击查看可以快速查看关联了该监控规则模板的所有数据资源。

image.png

关联了某些资源后,可以在对应Project的告警中心查看到自动创建出来的模板告警,取消了某些资源的关联后,可以在对应Project的告警中心查看到模板告警自动被删除。

点击模板告警的编辑后,会提示用户该告警监控规则的修改会对关联了该监控规则的所有数据资源生效。

image.png

点击模板告警的删除模板后,可以删除掉关联了该监控规则模板的所有告警和规则模板本身。

使用限制

  • 目前告警监控规则模板仅支持添加一条查询分析语句。即您在创建或编辑告警监控规则时只能添加一条查询分析语句,否则在转为模板或保存模板时报错。

  • 由于告警监控规则模板涉及跨Project操作,如果您使用的是RAM用户,则您需要确保该RAM用户对目标Project也具备告警操作权限。

相关实践学习
日志服务之使用Nginx模式采集日志
本文介绍如何通过日志服务控制台创建Nginx模式的Logtail配置快速采集Nginx日志并进行多维度分析。
目录
相关文章
|
4月前
|
Prometheus 运维 监控
智能运维实战:Prometheus与Grafana的监控与告警体系
【10月更文挑战第26天】Prometheus与Grafana是智能运维中的强大组合,前者是开源的系统监控和警报工具,后者是数据可视化平台。Prometheus具备时间序列数据库、多维数据模型、PromQL查询语言等特性,而Grafana支持多数据源、丰富的可视化选项和告警功能。两者结合可实现实时监控、灵活告警和高度定制化的仪表板,广泛应用于服务器、应用和数据库的监控。
530 3
|
9天前
|
运维 监控 虚拟化
除了实时性能监控,Hyper-V还支持日志记录和警报功能你知道吗?
Hyper-V不仅支持实时性能监控,还具备强大的日志记录和警报功能。通过事件查看器可访问详细的日志文件,涵盖虚拟机管理、配置及Hypervisor事件,帮助故障排查和性能分析。警报功能支持预定义和自定义规则,可通过多种方式通知管理员,确保及时响应问题,保障虚拟化环境的稳定运行。
|
7月前
|
Prometheus 监控 Cloud Native
【监控】prometheus传统环境监控告警常用配置
【监控】prometheus传统环境监控告警常用配置
【监控】prometheus传统环境监控告警常用配置
|
3月前
|
Prometheus 监控 Cloud Native
无痛入门Prometheus:一个强大的开源监控和告警系统,如何快速安装和使用?
Prometheus 是一个完全开源的系统监控和告警工具包,受 Google 内部 BorgMon 系统启发,自2012年由前 Google 工程师在 SoundCloud 开发以来,已被众多公司采用。它拥有活跃的开发者和用户社区,现为独立开源项目,并于2016年加入云原生计算基金会(CNCF)。Prometheus 的主要特点包括多维数据模型、灵活的查询语言 PromQL、不依赖分布式存储、通过 HTTP 拉取时间序列数据等。其架构简单且功能强大,支持多种图形和仪表盘展示模式。安装和使用 Prometheus 非常简便,可以通过 Docker 快速部署,并与 Grafana 等可
878 2
|
7月前
|
存储 Prometheus 监控
程序开发中的监控和日志分析
监控和日志分析在软件开发中至关重要,它们帮助实时了解应用状态、及时发现并解决问题。监控确保系统稳定运行,优化性能和资源;日志分析则助于追踪问题根源、监测用户行为并提供安全审计。利用如Prometheus、ELK Stack等工具可实现高效监控与日志管理,从而优化应用性能和用户体验。
259 0
|
4月前
|
Oracle 关系型数据库 数据库
【赵渝强老师】Oracle的参数文件与告警日志文件
本文介绍了Oracle数据库的参数文件和告警日志文件。参数文件分为初始化参数文件(PFile)和服务器端参数文件(SPFile),在数据库启动时读取并分配资源。告警日志文件记录了数据库的重要活动、错误和警告信息,帮助诊断问题。文中还提供了相关视频讲解和示例代码。
124 1
|
5月前
|
存储 监控 固态存储
如何监控和优化 WAL 日志文件的存储空间使用?
如何监控和优化 WAL 日志文件的存储空间使用?
145 1
|
4月前
|
Prometheus 运维 监控
智能运维实战:Prometheus与Grafana的监控与告警体系
【10月更文挑战第27天】在智能运维中,Prometheus和Grafana的组合已成为监控和告警体系的事实标准。Prometheus负责数据收集和存储,支持灵活的查询语言PromQL;Grafana提供数据的可视化展示和告警功能。本文介绍如何配置Prometheus监控目标、Grafana数据源及告警规则,帮助运维团队实时监控系统状态,确保稳定性和可靠性。
484 0
|
5月前
|
监控 网络协议 CDN
阿里云国际监控查询流量、用量查询流量与日志统计流量有差异?
阿里云国际监控查询流量、用量查询流量与日志统计流量有差异?
|
7月前
|
存储 运维 监控
监控与日志管理:保障系统稳定运行与高效运维的基石
【8月更文挑战第16天】监控与日志管理是保障系统稳定运行和高效运维的基石。它们不仅能够帮助企业及时发现并解决问题,还能够为性能调优、资源优化和业务决策提供有力支持。因此,在构建系统架构时,企业应高度重视监控与日志管理的规划和实施,确保它们能够充分发挥作用,为企业的发展保驾护航。同时,随着技术的不断进步和应用场景的不断拓展,监控与日志管理也将持续演进和创新,为企业带来更多的价值和便利。