云原生技术正在激活应用构建新范式,构筑企业业务运行新基石。在推动各行各业拥抱云原生、用技术加速创新的过程中,阿里云云原生致力于为企业提供系统稳定、资源弹性、应用敏捷、业务智能、可信安全的五大核心价值,通过输出先进的技术服务和完整的产品体系,让企业放心用云、用好云。
阿里云坚持与业界同行,积极参与信通院各项云原生规模化落地标准制定和推广的共建工作中。本次阿里云容器服务团队作为参编方,协同构建了首个信通院“容器集群稳定性评估”标准,为业界提供底层云服务稳定性评估和度量方案,促进上层业务的稳定性和业务连续性,提升应用的风险可控能力。
容器服务 ACK 荣获
首批容器集群稳定性“先进级”认证
2023 信通院容器稳定性测试涵盖容器集群节点稳定性、应用稳定、规模化稳定 3 大类别、33 个用例。阿里云容器服务 ACK 在测试中高标准通过全部用例,特别是控制面多可用区应用容灾,元数据容灾,以及应用高可用,流量容灾,控制面组件自运维证书过期轮转等能力上通过故障注入和 1-5-10 的快速自动恢复,体现出阿里云 ACK 稳定性保障达到行业领先水平。
1. 高可用技术底座
- 在集群拓扑上,ACK 托管机器默认提供了多可用区(Availability Zone - AZ)的高可用 K8s 集群部署架构,为分布式集群管理和分布式应用部署提供丰富的可用性最佳实践,提供了多副本冗余、负载均衡与服务发现、故障域隔离、健康检测与自愈、应用与数据解耦等能力;
- 在服务质量保障上,针对高水位状态下工作负载对运行质量的敏感问题,ACK 提供了一套增强负载感知调度与重调度框架,避免节点负载过高导致机器出现热点响应慢等影响稳定性的问题,支持用户在特定时间内持续调整集群资源编排以达到理想状态,使典型场景下资源利用率提升达 100%、低优先级任务对延迟敏感型任务影响 < 5%;
- 在超大集群的支撑上,针对 apiserver、etcd 等进行专门的性能优化,高效支撑电商、搜索、大数据、AI 等多种集群场景。
2. 可观测和智能运维
- 在全链路可观测方面,阿里云 ACK 支持从应用层、容器层到节点层的全景可观测。阿里云 Prometheus for ACK 将 K8s master 内部核心组件的监控事件、异常请求通过可交互大盘完全展现,在节点层结合 eBPF 实现了无侵入式应用监测,并针对高基数长周期的监控查询实现了 5 倍的性能优化;
- 在智能运维方面,ACK AIOps 套件的自动化诊断能力能够覆盖 90% 的运维问题,帮助企业规避由集群升级等带来的风险;ACK 通过容器智能网络诊断工具 KubeSkoop 帮助企业自动进行网络报文构建,模拟立体网络拓扑,自动分析诊断网络情况并降低网络异常情况。
3. 安全可信的软件供应链
- 通过集群容器安全概览,ACK 可帮助安全管理员对集群安全水位有更好地感知,做到对集群配置、应用镜像、容器运行时安全风险等的及时发现与处理;
- 提供了完备的 DevSecOps 产品能力,在容器软件供应链中对安全风险进行自动化分析、修复和阻断,为企业提供安全可信的软件供应链。
阿里云容器服务提供高性能可伸缩的容器应用管理能力,支持企业级容器化应用的全生命周期管理。得益于阿里集团和阿里云的大规模容器应用实践,阿里云容器产品能力得到业界广泛认可,是国内唯一连续三年入选 Gartner 公共云容器报告、国内唯一进入 Forrester 领导者象限的产品,为云上各行各业的万余家企业客户提供服务。
点击阅读原文,了解阿里云容器服务更多详情。