SLS告警最佳实践—— K8s事件中心告警管理

本文涉及的产品
对象存储 OSS,20GB 3个月
云备份 Cloud Backup,100GB 3个月
阿里云盘企业版 CDE,企业版用户数5人 500GB空间
简介: K8S事件中心是SLS的日志应用之一,主要记录了集群的状态变更,包括创建Pod、运行Pod、删除Pod、组件异常等。K8S事件中心实时收集K8S中的所有事件并提供存储、查询、分析、可视化与告警能力。K8s事件中心默认也会提供仪表盘和告警,本文主要介绍下如何在ACK控制台和SLS控制台管理K8s事件中心的告警及其区别和使用场景。

K8s事件中心

K8S事件中心是SLS的日志应用之一,主要记录了集群的状态变更,包括创建Pod、运行Pod、删除Pod、组件异常等。K8S事件中心实时收集K8S中的所有事件并提供存储、查询、分析、可视化与告警能力。K8s事件中心默认也会提供仪表盘和告警,本文主要介绍下如何在ACK控制台和SLS控制台管理K8s事件中心的告警及其区别和使用场景。


K8s事件中心管理

K8s事件中心的告警配置可以ACK控制台开启,也可以在SLS控制台开启,两个控制台的告警规则是一致的,使用场景会有些区分,在实际使用中,建议根据不同场景开启不同控制台的告警,同时开启会造成告警重复。

  • ACK控制台:创建集群时默认开启(支持关闭),内置通知联系人,目前支持短信和邮件,后续会有更多通知渠道支持。
  • SLS控制台:在K8S事件中心应用中,批量开启告警规则,允许配置灵活的通知策略和多种通知渠道包括webhook,钉钉等。


K8s事件中心开启入口

ACK控制台

在ACK控制台创建集群时,如果开启了报警配置,会自动开启事件中心及告警。参考链接

SLS控制台

在SLS控制台日志应用->K8s事件中心可以创建或者查看K8s事件中心仪表盘和告警,有如下两种情况:

  • 在ACK控制台创建集群时已勾选告警配置,SLS K8s事件中心会默认显示已开启的集群。
  • 在ACK控制台未勾选告警配置,可以参考创建并使用K8s事件中心,手动进行配置。

K8s事件中心告警管理入口

ACK控制台

  • 如果已经购买了集群,可以通过ACK控制台集群列表->集群->运维管理->报警配置,来查看,开启,关闭告警。

在ACK控制台页面可以进行编辑通知对象,联系人管理,查看报警历史等,目前通知渠道包括短信和邮箱,后续会增加更多通知渠道。


SLS控制台

  1. SLS控制台首页,找到日志应用,点击查看更多日志应用->K8s事件中心,进入K8s事件中心应用页面。

  1. 在k8s事件中心左侧菜单找到对应的集群,进入告警配置->勾选SLS k8s事件中心

  1. 勾选一个或者多个规则,点击配置Cluster ID,弹出框里填集群ID或者集群名,这个字段将在默认的SLS ACK内置内容模板中引用。用法为${annotations.cluster_id}

  1. 勾选一个或者多个内置告警规则,批量开启告警规则

  1. 光标放在任意一个内置规则后面的问号图标,点击弹出框显示的行动策略SLS ACK内置行动策略,点击跳转进行配置(行动策略可以简单理解为通知配置)。

  1. SLS ACK内置行动策略中默认配置了不同的告警触发时,默认发送到短信渠道。
  • 通知内容分为三类:
  • 标签.object_name存在,表示事件中心的告警是object相关,对应的内容模板为SLS ACK Object内置内容模板。
  • 标签.pod_name存在,表示事件中心的告警是pod相关,对应的内容模板为SLS ACK Pod内置内容模板。
  • 标签.node_name存在,表示事件中心的告警是node相关,对应的内容模板为SLS ACK Node内置内容模板。
  • 其他,对应的内容模板为SLS ACK 内置内容模板。
  • 接收人默认为SLS内置用户组,可以点击接收人右边的查看按钮,修改用户组中的用户
  • 如果需要增加通知渠道可以点击行动组添加通知渠道按钮,添加其他通知渠道,但是内容模板强烈建议使用对应条件的SLS ACK ...内置内容模板,如果有修改需求,可以直接修改内置内容模板或者复制一个内置内容模板进行修改。


常见问题

  • ACK控制台的K8s事件中心告警与SLS控制台的“SLS K8s事件中心”的告警有什么不同?
  • 监控的logstore是一致的,都是监控k8s project下的k8s-event。
  • 告警监控规则也是一致的,都是内置监控规则。
  • ACK控制台和SLS控制台的告警开启该如何选择?
  • ACK控制台的K8s告警理解为极简告警,几乎只需要点开启按钮,即可完全开启监控规则,通知渠道支持短信和邮件。暂时不支持webhook或者钉钉。
  • SLS控制台K8s告警需要配置集群ID,支持批量开启/关闭,支持设置更多的通知渠道,例如webhook,钉钉,飞书,Function Compute等,具体可以参考链接
  • 如果需要更多的通知渠道,可以暂时关闭ACK控制台的告警,在SLS控制台开启相应的K8s告警,如果两者都开,会有重复告警,建议只开启一个。
  • 如果需要根据不同的namepace等配置不同的接收人,可以使用SLS控制台的K8s事件中心告警的内置行动策略:SLS ACK内置行动策略进行行动组条件的修改,默认情况下SLS的K8s事件中心告警都会使用同一个内置行动策略。
  • 在SLS控制台的Project为什么可以看到自定义的K8s事件中心告警?
  • 在K8s的Project的告警中心标签会默认展示Project下所有的告警:
  • ACK控制台开启的告警同样会展示在Project下(目前不支持对ACK控制台开启的告警进行编辑)
  • K8s事件中心的旧版告警是自定义告警,旧版告警在数量上比新版的内置告警规则会少很多,强烈建议关闭旧版告警,使用内置告警规则配置更灵活的通知。如果有自定义告警需求,建议使用新版自定义告警。
  • K8s事件中心告警的评估频率是多少?
  • 目前是5分钟评估一次,暂时不支持修改;如果需要更高频率的配置,可以在k8s-event上使用新建新版自定义告警来完成。

参考链接


相关实践学习
通过云拨测对指定服务器进行Ping/DNS监测
本实验将通过云拨测对指定服务器进行Ping/DNS监测,评估网站服务质量和用户体验。
目录
相关文章
|
22天前
|
Kubernetes 监控 开发者
掌握容器化:Docker与Kubernetes的最佳实践
【10月更文挑战第26天】本文深入探讨了Docker和Kubernetes的最佳实践,涵盖Dockerfile优化、数据卷管理、网络配置、Pod设计、服务发现与负载均衡、声明式更新等内容。同时介绍了容器化现有应用、自动化部署、监控与日志等开发技巧,以及Docker Compose和Helm等实用工具。旨在帮助开发者提高开发效率和系统稳定性,构建现代、高效、可扩展的应用。
|
3月前
|
Kubernetes Ubuntu Windows
【Azure K8S | AKS】分享从AKS集群的Node中查看日志的方法(/var/log)
【Azure K8S | AKS】分享从AKS集群的Node中查看日志的方法(/var/log)
136 3
|
10天前
|
消息中间件 测试技术
通过轻量消息队列(原MNS)主题HTTP订阅+ARMS实现自定义数据多渠道告警
轻量消息队列(原MNS)以其简单队列模型、轻量化协议及按量后付费模式,成为阿里云产品间消息传输首选。本文通过创建主题、订阅、配置告警集成等步骤,展示了该产品在实际应用中的部分功能,确保消息的可靠传输。
30 2
|
14天前
|
Oracle 关系型数据库 数据库
【赵渝强老师】Oracle的参数文件与告警日志文件
本文介绍了Oracle数据库的参数文件和告警日志文件。参数文件分为初始化参数文件(PFile)和服务器端参数文件(SPFile),在数据库启动时读取并分配资源。告警日志文件记录了数据库的重要活动、错误和警告信息,帮助诊断问题。文中还提供了相关视频讲解和示例代码。
|
2月前
|
Kubernetes API Docker
跟着iLogtail学习容器运行时与K8s下日志采集方案
iLogtail 作为开源可观测数据采集器,对 Kubernetes 环境下日志采集有着非常好的支持,本文跟随 iLogtail 的脚步,了解容器运行时与 K8s 下日志数据采集原理。
|
1月前
|
NoSQL 关系型数据库 Redis
高可用和性能:基于ACK部署Dify的最佳实践
本文介绍了基于阿里云容器服务ACK,部署高可用、可伸缩且具备高SLA的生产可用的Dify服务的详细解决方案。
|
2月前
|
Kubernetes Docker 微服务
构建高效的微服务架构:基于Docker和Kubernetes的最佳实践
在现代软件开发中,微服务架构因其灵活性和可扩展性而受到广泛青睐。本文探讨了如何利用Docker和Kubernetes来构建高效的微服务架构。我们将深入分析Docker容器的优势、Kubernetes的编排能力,以及它们如何结合实现高可用性、自动扩展和持续部署。通过具体的最佳实践和实际案例,读者将能够理解如何优化微服务的管理和部署过程,从而提高开发效率和系统稳定性。
|
3月前
|
Kubernetes 安全 数据安全/隐私保护
Kubernetes 安全性最佳实践
【8月更文第29天】随着容器化和微服务架构的普及,Kubernetes 已成为管理容器化应用的标准平台。然而,随着 Kubernetes 的广泛采用,其安全性问题也日益受到关注。本文将深入探讨 Kubernetes 的安全最佳实践,并通过具体的代码示例来展示如何保护 Kubernetes 集群免受攻击。
179 2
|
3月前
|
Kubernetes jenkins 持续交付
Kubernetes CI/CD 集成:持续交付的最佳实践
【8月更文第29天】随着微服务架构和容器化的普及,Kubernetes 成为了运行容器化应用的事实标准。为了确保应用能够快速迭代并稳定发布,持续集成/持续部署(CI/CD)流程变得至关重要。本文将介绍如何将 Kubernetes 集成到 CI/CD 流程中,并提供一些最佳实践。
281 1
|
3月前
|
消息中间件 Kubernetes API
在K8S中,如何收集k8s集群日志?
在K8S中,如何收集k8s集群日志?

相关产品

  • 日志服务
  • 下一篇
    无影云桌面