5分钟搞定AlertManager接入短信、语音等10+种通知渠道

本文涉及的产品
对象存储 OSS,20GB 3个月
对象存储 OSS,内容安全 1000 次 1年
日志服务 SLS,月写入数据量 50GB 1个月
简介: Alert Manager是开源监控系统Prometheus中用于处理告警信息的服务,通过将日志服务开放告警配置为Alert Manager中的一个Receiver,可以将Alert Manager产生的告警消息发送到日志服务。

SLS告警管理

AlertManager作为Prometheus生态系统的一员,提供了包括静默、抑制、通知在内的多种告警管理服务。同时AlertManager在实际使用中还存在着或多或少的不足,例如通知渠道过少,规则配置过程繁琐。

阿里云日志服务为了解决告警的通知、管理等问题,推出了日志服务告警中心,为客户提供了一站式的告警解决方案。下图中的功能对比给出了SLS告警和AlertManager+Prometheus生态的功能对比,可以看出SLS告警提供了企业级的服务,能够极大的方便用户的工作。

SLS开放告警

SLS告警提供的开放告警功能,能够很方便的将三方系统的告警消息接入到SLS告警中心,而且不需要对现有系统做任何改造。AlertManager接入SLS告警后的告警消息流如下图所示:

下面介绍将AlertManager接入到SLS告警的详细流程,包括SLS告警配置和AlertManager配置两部分。

SLS告警配置

1. 创建行动策略

行动策略将决定了SLS在接收Alert Manager告警消息后,以何种方式及何种渠道通知您。为此,您需要首先打开告警中心,点击告警管理,在下拉菜单中选择行动策略

然后点击页面左上角的添加按钮,在弹出的对话框中配置新的行动策略,然后点击确认。目前,系统支持语音,短信,邮箱,钉钉和企业微信等通知渠道,有关行动策略的具体配置方法,可参阅官方文档创建行动策略

2. 创建开放告警服务

首先打开告警中心,点击告警管理,在下拉菜单中选择开放告警

点击页面左上角的创建按钮,在弹出的对话框中配置新的开放告警服务,包括服务ID和服务名称,然后点击保存

3. 创建开放告警应用

选择上一步骤中创建的服务,在操作栏中点击该服务的应用按钮:

在弹出的对话框中点击创建,添加新的应用,点击保存。这里的协议请选择AlertManager,行动策略选择在第一步中配置的策略,其余选项可选择默认值。

4. 获取开放告警应用接口

现在,您在第二步创建的开放告警服务中已经存在一个新的告警应用了。点击该应用操作栏的接口按钮,获取接口信息:

接口地址由两部分构成:

  • 域名部分:SLS的接入地址,和地域相关,每个地域都有各自不同的接入地址;
  • 子路径部分:包括用于发送消息的Access Key Id和开放告警应用Id。需要注意的是,用户需要将子路径部分中的{ACCESS_KEY_ID}替换为具体阿里云RAM账户的Access Key Id,并且将权限策略AliyunLogOpenEventWrite赋予该账户。

Alert Manager接入配置

在Alert Manager配置文件中,您首先需要创建一个告警消息的接收者。为此,您需要在receivers配置项下添加一个Webhook接收者,在url字段中填写上一步骤中获取的接口地址。然后,您需要在route配置项下添加前面创建的接收者。典型的配置文件如下图所示:

route:

 receiver: '{RECIEVER_NAME}'

 ...

 

...


receivers:

- name: '{RECIEVER_NAME}'

 webhook_configs:

 - url: 'http://{ALIYUN_SLS_ENDPOINT}/event/webhook/RAMAK_{ACCESS_KEY_ID}/{WEBHOOK_APP_ID}'

 

- name: ...

其中{RECIVER_NAME}为用户为接收者自定义的名称。

效果展示

告警消息查看

在告警中心的事务视图界面,可以查看接收到的告警消息列表,以及该告警消息的详情。

告警接入概览

开放告警大盘,可以查看告警消息过滤、发送情况。

告警通知概览

告警大盘展示了所有告警消息的概览视图,可以查看通过不同通知渠道发送的消息量。



相关实践学习
通过轻量消息队列(原MNS)主题HTTP订阅+ARMS实现自定义数据多渠道告警
本场景将自定义告警信息同时分发至多个通知渠道的需求,例如短信、电子邮件及钉钉群组等。通过采用轻量消息队列(原 MNS)的主题模型的HTTP订阅方式,并结合应用实时监控服务提供的自定义集成能力,使得您能够以简便的配置方式实现上述多渠道同步通知的功能。
目录
相关文章
|
Kubernetes Linux Docker
【kubernetes】修复 linux 服务器重启后,kubelet 启动失败的问题
【kubernetes】修复 linux 服务器重启后,kubelet 启动失败的问题
3336 1
|
容器 Docker 数据安全/隐私保护
阿里云开源 image-syncer 工具,容器镜像迁移同步的终极利器
为什么要做这个工具? 由于阿里云上的容器服务 ACK 在使用成本、运维成本、方便性、长期稳定性上大大超过公司自建自维护 Kubernets 集群,有不少公司纷纷想把之前自己维护 Kubernetes 负载迁移到阿里云 ACK 服务上。
|
存储 Prometheus 监控
Prometheus 的报警机制:Alertmanager 的配置与使用
【8月更文第29天】Prometheus 是一个非常强大的监控系统,它不仅能够收集和存储时间序列数据,还能通过 Alertmanager 提供灵活的报警机制。Alertmanager 负责接收 Prometheus 发送的警报,并根据配置的规则执行相应的通知动作。本文将详细介绍如何配置 Alertmanager 以及如何使用它来实现基于 Prometheus 指标的报警通知。
3434 1
|
3月前
|
人工智能 JSON 运维
🚀🚀 【MCP + AI】grafana-mcp-analyzer:基于 MCP 的轻量图表分析助手
`grafana-mcp-analyzer` 是一个开源项目,通过 MCP 协议连接 AI 助手与 Grafana,实现智能分析监控数据。只需简单配置,AI 可快速解读图表,提供性能瓶颈、优化建议等专业分析,极大提升运维效率。支持多种数据源(Prometheus、ES 等),适配 ChatGPT、Claude 等模型,部署轻量,操作便捷。从此告别深夜手动排查问题,让 AI 成为你的智能运维专家!项目地址:<https://github.com/SailingCoder/grafana-mcp-analyzer>
450 1
🚀🚀 【MCP + AI】grafana-mcp-analyzer:基于 MCP 的轻量图表分析助手
|
10月前
|
存储 Prometheus 运维
在云原生环境中,阿里云ARMS与Prometheus的集成提供了强大的应用实时监控解决方案
在云原生环境中,阿里云ARMS与Prometheus的集成提供了强大的应用实时监控解决方案。该集成结合了ARMS的基础设施监控能力和Prometheus的灵活配置及社区支持,实现了全面、精准的系统状态、性能和错误监控,提升了应用的稳定性和管理效率。通过统一的数据视图和高级查询功能,帮助企业有效应对云原生挑战,促进业务的持续发展。
259 3
|
存储 测试技术 索引
「译文」Loki 简明指南:如何处理失序和较旧的日志
「译文」Loki 简明指南:如何处理失序和较旧的日志
|
存储 Prometheus 监控
Alertmanager配置概述及告警规则
Alertmanager配置概述及告警规则
|
Prometheus 监控 Cloud Native
Linux|centos7下部署安装alertmanager并实现邮箱和微信告警(基础篇---二)
Linux|centos7下部署安装alertmanager并实现邮箱和微信告警(基础篇---二)
830 0
|
Prometheus Kubernetes Cloud Native
报警神器Alertmanager发送报警到多个渠道
报警神器Alertmanager发送报警到多个渠道