Prometheus AlertManager 生产实践 - 直接根据 to_email label 发 alert 到对应邮箱

简介: Prometheus AlertManager 生产实践 - 直接根据 to_email label 发 alert 到对应邮箱

概述

通过之前的文章 - Prometheus Alertmanager 生产配置趟过的坑总结, 我们已经知道 AlertManager 作为告警平台,是非常强大的,可以去重 (deduplicating),分组 (grouping),并将它们路由 (routing) 到正确的接收器 (receiver) 集成,如电子邮件,微信,或钉钉。它还负责处理警报的静默 / 屏蔽 (silencing)、定时发送 / 不发送 (Mute) 和抑制 (inhibition) 问题。

正常的 AlertManager 处理告警流程,是要经过 Alerts -> Route -> Receivers 这么一个步骤的

  1. Alerts 里带了一些标签,如 env, team, job 等
  2. 根据提前编辑好的 Route, 对 alerts 进行路由,比如 env=prod 的发给哪些 receiver, team=db 的发给哪些人。…
  3. 在 Receivers 里已经提前录入了这些需要处理 prod,处理 db 告警的 receivers 邮箱。告警这样发给对应的收件人。

但是,假如我在 Alerts 里自带收件人信息(如邮箱),能不能直接使用?而不需要再录入所有的 receivers。

答案当然是可以!通过模板(template)实现这个需求。Let’s GO!💪💪💪

模板(Template)简介

AlertManager 模板最初的目的是为了对告警的消息做定制化的。

比如同样的 Alerts,我:

  • 通过 SMS 发送,期望是纯文本格式;
  • 通过 email 发送,期望是 HTML 格式;
  • 通过钉钉、企微发送,期望是 Markdown 格式;
  • 而且在这些渠道中,
  • 标题是不同的排列组合
  • 告警内容也是不同的段落格式和用词(比如通过钉钉、企微会加入更多的 emoji)

AlertManager 模板是和 Prometheus 模板一样,使用的同样是 Go template。当然,具体的数据和函数会有细微的区别,因为在这里主要处理的是告警 而非单个告警。

示例如下:

receivers:
  - name: emergency
    slack_configs:
    - api_url: https://hooks.slack.com/services/XXXXXXXX
      channel: '#emergency'
      title: 'Alerts in {{ .GroupLabels.cluster }} {{ .GroupLabels.env }}!'
YAML

AlertManager 进阶

除了模板化 txt 字段,通知的定义(比如:发给谁)也可以被模板化。通常每个 team 都有自己的路由树,以及相对应的收件人(receivers)。如果另一个团队(不是监控团队,也不是运维团队,而是测试等团队)想要发送给自己团队告警,他们需要从头到尾设置 label、设置匹配其团队 labels 的路由树、把团队内的收件人信息配置到 AlertManager 的 receiver 里。

那如果你是监控团队,你用 AlertManager 做了个告警平台提供给外部团队甚至客户使用,每次都得这么搞会有“亿点点”麻烦。

该怎么办呢?🤔🤔🤔

解决方案

解决方案就是:

  • Label
  • AlertManager 通知模板

首先,直接在 Label 里提供相关的接收人信息,然后通过 AlertManager 的模板,将 receiver -> to 写上对应的模板即可。

具体演示如下:

方案演示

首先,是包含收件人信息 label 的 alerts,如下:

[
  {
    "labels": {
      "alertname": "<requiredAlertName>",
      "<labelname>": "<labelvalue>",
      "email_to": "foo@example.com,bar@example.com",
      ...
    },
    "annotations": {
      "<labelname>": "<labelvalue>",
    },
    "startsAt": "<rfc3339>",
    "endsAt": "<rfc3339>",
    "generatorURL": "<generator_url>"
  },
  ...
]
JSON

每个 alert 都提供 email_to 这样的 label。

然后,在 AlertManager 中,可以设置如下 routereceiver, 如下:

global:
  smtp_smarthost: 'localhost:25'
  smtp_from: 'smtp@example.com'
route:
  group_by: [email_to, alertname]
  receiver: customer_email
receivers:
  - name: customer_email
    email_configs:
      - to: '{{ .GroupLabels.email_to }}'
    headers:
      subject: 'Alert: {{ .GroupLabels.alertname }}'
YAML

注意,group_by 必须包括 email_to label,这样它才算 .GroupLabels. 下的一员。

当有 alerts 来时,如 "email_to": "foo@example.com,bar@example.com", 会 route 到 customer_email, 其收件人是 {{ .GroupLabels.email_to }}, 会被模板化为: foo@example.com,bar@example.com, 告警邮件自然就会发过去。

完成!🎉🎉🎉


相关文章
|
7月前
|
Prometheus 监控 Kubernetes
Prometheus+Grafana+Alertmanager搭建全方位的监控告警系统-超详细文档(上)
Prometheus+Grafana+Alertmanager搭建全方位的监控告警系统-超详细文档
|
3月前
|
存储 Prometheus 监控
Prometheus Alertmanager 生产配置趟过的坑总结
Prometheus Alertmanager 生产配置趟过的坑总结
|
6月前
|
Prometheus Cloud Native 网络安全
Prometheus+Grafana+Alertmanager部署教程(超详细)
Prometheus+Grafana+Alertmanager部署教程(超详细)
376 1
|
7月前
|
Prometheus Kubernetes 监控
Prometheus+Grafana+Alertmanager搭建全方位的监控告警系统-超详细文档(下)
Prometheus+Grafana+Alertmanager搭建全方位的监控告警系统-超详细文档
|
10月前
|
Prometheus 运维 Cloud Native
【2023】Prometheus-接入Alertmanager并实现邮件告警通知
【2023】Prometheus-接入Alertmanager并实现邮件告警通知
285 0
|
12月前
|
弹性计算 Prometheus 监控
《2021 阿里云可观测技术峰会演讲实录合辑(下)》——一、基于OPLG从0到1构建统一可观测平台实践——场景实践2:如何基于Prometheus和Grafana做统一的监控和告警
《2021 阿里云可观测技术峰会演讲实录合辑(下)》——一、基于OPLG从0到1构建统一可观测平台实践——场景实践2:如何基于Prometheus和Grafana做统一的监控和告警
232 0
|
12月前
|
存储 Prometheus 监控
重磅!DIY的Prometheus主备方案,全网唯一。生产未上,测试先行。
重磅!DIY的Prometheus主备方案,全网唯一。生产未上,测试先行。
252 0
|
Prometheus Cloud Native Docker
docker 安装 prometheus、grafana 和 alertmanager
docker 安装 prometheus、grafana 和 alertmanager
370 0
EMQ
|
数据采集 存储 Prometheus
EMQX+Prometheus+Grafana:MQTT 数据可视化监控实践
本文介绍了如何将EMQX 5.0的监控数据集成到Prometheus中,使用Grafana来展示EMQX的监控数据,并最终搭建出一个简单的MQTT数据可视化监控系统。
EMQ
532 0
EMQX+Prometheus+Grafana:MQTT 数据可视化监控实践
|
消息中间件 存储 弹性计算
可观测实践|如何利用 Prometheus 精细化观测云产品
随着企业使用越来越多的云产品,如何监控不同云产品运行状态,又该如何建立统一大盘,不妨看看如何通过阿里云Prometheus解决上述问题。
可观测实践|如何利用 Prometheus 精细化观测云产品