社区的 K8s 中包含了非常成熟的事件体系,提供了应用层的事件以及 runtime 层的 事件。ACK 可观测体系在社区的事件体系之上,从表层到底层都进行了覆盖和增强, 做到了可观测事件体系的全覆盖。
• 应用异常:对于 K8s 的应用事件提供了用户灰度发布以及 HPA 等异常行为的事 件监控。
• 管控操作事件:增加了集群的管控事件、用户对集群的异常操作以及重要变更, 甚至包括成本和预算超标等。
• 集群核心组件异常:集群的稳定性很大一部分由集群核心组件的健康来保证。 对于集群核心组件包括 API server、ETCD、Scheduler、CCM 等都做了异常事 件的增强,出现异常事件能够第一时间进行触达。此外,还包括用户侧核心组 件 addon 事件,比如 Terway、存储等。
• 集群容器引擎层异常:对集群容器引擎层做了增强,包括了 Container Runtime、 Kubelet、Cgroup 等异常。
• 节点异常:包括 OS/内核层异常,比如操作系统内核宕机、操作系统配置的异 常等,也包括资源层异常比如网络资源异常、存储资源异常、其他云资源异常 等,为容器服务的运维保障及功能更强的覆盖提供了支持。
以上内容摘自 《2021 阿里云可观测技术峰会演讲实录合辑(上)》 电子书,点击https://developer.aliyun.com/ebook/download/7771 可下载完整版
版权声明:本文内容由阿里云实名注册用户自发贡献,版权归原作者所有,阿里云开发者社区不拥有其著作权,亦不承担相应法律责任。具体规则请查看《阿里云开发者社区用户服务协议》和《阿里云开发者社区知识产权保护指引》。如果您发现本社区中有涉嫌抄袭的内容,填写侵权投诉表单进行举报,一经查实,本社区将立刻删除涉嫌侵权内容。