开发者学堂课程【5分钟玩转阿里云容器服务:容器可观测-ACK 可测观体系全景】学习笔记,与课程紧密联系,让用户快速学习知识。
课程地址:https://developer.aliyun.com/learning/course/1038/detail/16076
容器可观测-ACK 可测观体系全景
内容介绍
一、容器可观测-ACK 可测观体系全景
一、容器可观测-ACK 可测观体系全景
阿里云容器服务可观测体系的全景概要。
首先从权威咨询机构 forest 的分析师报告中强调一下可观测能力对用户 IT 系统的重要性。
阿里云容器服务 ACK 在 2022 年一季度 forest 的公共云容器平台领域的报告中首次荣获比肩 Google 的全球领导者评级,这也是首次有中国公司金融此领域的领导者下线评级。
其中可观测能力是评级的重要评测项,且阿里云容器服务 ACK 的可观测能力得到了分析师的高度认可。
分析师对 ACK 可观测能力的评价是能力卓越,产品间无缝衔接,定位异常问题时高效。
阿里云容器服务旨在为用户提供稳定的集群环境时,可观测能力是为用户构建 it 系统运维体系的不可或缺的重要能力。为大家介绍阿里云容器服务可观测体系的全景图 。
可以看到,把容器服务的可观测体系分为四层,自上而下分别是业务监控层、应用性能监控、 APM 层容容器层监控以及最下面的基础设施层监控。可观测体系的三大支柱 login Tracy magic 贯穿于容器服务可观测体系的四层中。
首先业务监控层,这里使用日志服务为用户进行日志监控,使用 ingress 的大盘监控用户的业务流量,甚至使用 arms 前端监控,为用户的前端java script 页面进行插桩来统计用户的业务访问情况。
第二层,应用性能监控 APM 层。这里我们可以使用 ARMS APM 为用户的 Java 应用无侵入式的插桩,并监控应用的性能指标数据,同时提供 Java 的 jvm 性能监控以及 profiling 代码及调用 tracing 能力。多语言场景下,我们也支持 open pending metric 协议来进行 tracing 和性能指标的应用性能监控。
容器层监控,这里我们主要关注集群以及集群上的应用的监控情况。我们通过 ACK 事件中心,通过增强的 K8S 事件体系快速发现集群应用的异常。我们通过 ACK body 中心快速建立用户的 it OPS 运营体系,在面对异常情况时快速感知。通过开箱即用的阿姆斯普罗米修斯能力,我们可以对集群的自身稳定性,包括集群自身核心组件、集群上的应用工作负载、容器副本等多个维度进行实时这个指标监控。同时还支持 case 生态相关的如存储网络、 GPU 以及上层的中间件服务等多种重要场景的专项场景监控。
我们可以通过基于 Edpf 技术的 K8S 监控能力,如侵入的在系统内核层进行轻负载的监控或获取集群的网络调用 top 进行集群中应用的架构感知,以及排查集群中复杂网络链路的问题,最下层是集群依赖的基础设施层。
我们提供了增强的 ACK 实验体系,包括对节点的操作系统异常弹性是实例的虚拟化异常事件的增强集群依赖的相关资源如网络负载均衡、 ECS 弹性实例等基础设施的水位指标情况。我们也可以通过无缝集成云监控进行保障,以及通过 ACK 报警中心快速地配置异常报警。
接下来详细介绍客观侧体系中的 ACK 实验中心、日志中心以及普罗米修斯指标监控,以及后续介绍 ACK 成本分析能力为零的集群和应用降本增效。






