阿里云 ACK One 多集群管理全面升级:多集群服务、多集群监控、两地三中心应用容灾

本文涉及的产品
容器镜像服务 ACR,镜像仓库100个 不限时长
应用实时监控服务-应用监控,每月50GB免费额度
Serverless 应用引擎免费试用套餐包,4320000 CU,有效期3个月
简介: 本文介绍了 ACK One 近期发布的 3 个主要特性,覆盖了多集群管理的 3 个主要场景,跨集群服务发现与访问、多集群全局监控、应用容灾。除多集群管理外,ACK One 更是支持连接并管理任何地域、任何基础设施上的 Kubernetes 集群,提供一致的管理和社区兼容的 API,支持对计算、网络、存储、安全、监控、日志、作业、应用、流量等进行统一运维管控。

作者:宇汇


ACK One 概述


ACK One 是阿里云面向混合云、多集群、分布式计算等场景推出的分布式云容器平台,能够统一管理阿里云上、边缘、部署在客户数据中心以及其他云上的 Kubernetes 集群,并简化集群管理界面,让企业轻松应对多集群形态,从而灵活地根据自身业务和数据管控等需求,同时使部署在客户数据中心的集群也能获取云上弹性算力,实现“计算无界”。


1.png


三大重磅特性,覆盖三大场景,引领多集群管理新高度


多集群服务 -- 跨集群服务发现与访问


  • 概述
     

使用 Kubernetes 原生的 Service,可以方便地在集群内发现和访问 Service,但无法实现跨集群的 Service 发现与访问。随着业务的发展,应用往往需要多集群部署,实现隔离性,高可用性,例如:多个开发生产集群,不同业务不同集群,不同组织维护的集群,以解决可用性和数据所有权要求,灵活分账等需求。同时,不同业务应用间需要相互访问,因此需要一个跨集群 Service 方案,应对多集群带来的挑战。


ACK One 多集群管理发布新特性多集群服务,通过多集群服务实现 Kubernetes 原生 Service 的跨集群访问,打破了多集群服务访问的边界。


  • 场景一:跨集群服务发现与访问
     

2.png


ACK One 多集群服务支持 Kubernetes 社区多集群服务 API 标准,通过 ServiceExport、ServiceImport 对象实现跨集群的服务发现与访问。


1. 如图中链路 0 所示:管理员通过主控实例下发应用、多集群服务 ServiceExport、ServiceImport、分发规则等资源。


2. 如图中链路 1 所示:主控实例将应用和多集群服务资源,根据分发规则下发到关联集群中。


a.通过向 ACK Cluster 1 下发 ServiceExport 资源,定义 ACK Cluster 1 为服务提供者。


b.通过向 ACK Cluster 2 下发 ServiceImport 资源,定义 ACK Cluster 2 为服务消费者。 


3. 如图中链路 2 所示:ACK Cluster 2 上的 Client Pod 可以访问 ACK Cluster 1 上的 Service 1。


  • 场景二:多集群服务高可用

3.png


1. 如图中链路 0 所示:管理员通过主控实例下发应用、多集群服务 ServiceExport、ServiceImport、分发规则等资源。


2. 如图中链路 1 所示:


a.通过 ACK One 主控实例,将服务 Service1 同时部署在 ACK Cluster 1 和 ACK Cluster 3 中,实现高可用部署。


b.通过向 ACK Cluster 1 和 ACK Cluster 3 下发 ServiceExport 资源,定义 ACK Cluster 1 和 ACK Cluster 3 为服务提供者。


c.通过向 ACK Cluster 2 下发 ServiceImport 资源,定义 ACK Cluster 2 为服务消费者。


3. 如图中链路 2 所示:ACK Cluster 2 上的 Client Pod 可以负载均衡的访问 ACK Cluster 1 和 ACK Cluster 3 上的 Service 1。


  • 多集群服务方案优势
     

相比 LoadBalance/Ingress 等传统的 Kubernetes 服务跨集群暴露方案,ACK One 多集群服务不需要引入额外的负载均衡资源,仅通过定义服务提供者,消费者,即可实现跨集群的服务发现与访问。


相比服务网格的多集群服务方案,ACK One 多集群服务的实现非常轻量,不需要引入 sidecar 容器,没有额外的网络延时。同时,ACK One 多集群服务是托管在 ACK One 控制面的,省去运维成本。


详细请参见文末:多集群服务。


多集群全局监控 -- 运维利器,全局监控大盘


  • 概述
     

Prometheus 监控是 Kubernetes 集群监控的事实标准,在 ACK 容器服务中可以安装 Prometheus 监控组件,快速实现 ACK 集群监控,ACK 容器服务同时提供了大量的使用的监控大盘。但在多集群场景中,用户不得不单独维护每个集群的 Prometheus 监控组件。日常的运维中,需要频繁切换不同集群的监控大盘,在问题诊断中需要手工对比对各集群监控指标的差异。


4.png


ACK One 多集群全局监控基于单集群 Prometheus 的监控指标,通过多集群监控聚合实例汇总多个集群的监控指标,并提供多集群视角的全局监控大盘,让您可以在一个监控大盘上同时获取多个集群的监控指标,方便日常的运维工作。


  • 全局监控大盘
     

5.png


目前支持的大盘包括:全局集群无状态应用监控,TopN 全局集群节点监控,TopN 全局集群 Pod 监控。同时,ACK One 全局监控支持自定义监控大盘,您可以通过聚合实例构建自己的多集群监控大盘。


详细请参见文末:多集群全局监控。


多集群两地三中心应用部署 -- 应用容灾新选择


  • 概述
     

两地三中心是指在两个城市部署三个业务处理中心,即:生产中心、同城容灾中心、异地容灾中心。在一个城市部署 2 套环境形成同城双中心,同时处理业务并通过高速链路实现数据同步,可切换运行。在另一城市部署 1 套环境做异地灾备中心,做数据备份,当双中心同时故障时,异地灾备中心可切换处理业务。两地三中心容灾方案可以极大程度的保证业务的连续运行。


  • 方案架构


6.png


使用 ACK One 的多集群管理应用分发功能,可以帮助企业统一管理 3 个 K8s 集群,实现应用在 3 个 K8s 集群快速部署升级,同时实现应用在 3 个 K8s 集群上的差异化配置。配合使用 GTM(全局流量管理)可以实现在故障发生时业务流量在 3 个 K8s 集群的自动切换。对 RDS 数据层面的数据复制,可参考 DTS 数据传输服务。


详细请参见文末:使用 ACK One 构建应用系统的两地三中心容灾方案。

总结


本文介绍了 ACK One 近期发布的 3 个主要特性,覆盖了多集群管理的 3 个主要场景,跨集群服务发现与访问、多集群全局监控、应用容灾。除多集群管理外,ACK One 更是支持连接并管理任何地域、任何基础设施上的 Kubernetes 集群,提供一致的管理和社区兼容的 API,支持对计算、网络、存储、安全、监控、日志、作业、应用、流量等进行统一运维管控。阿里云分布式云容器平台(简称 ACK One)是面向混合云、多集群、分布式计算、容灾等场景推出的企业级云原生平台。


分布式云容器平台 ACK One 产品免费公测中,欢迎点击此处前往 ACK One 产品详情页开通体验。


参考链接:


[1] 分布式云容器平台 ACK One:

https://www.aliyun.com/product/aliware/adcp


[2] ACK One 产品控制台:

https://cs.console.aliyun.com/one


[3] 多集群服务:

https://help.aliyun.com/document_detail/440680.html


[4] 多集群全局监控:

https://help.aliyun.com/document_detail/434106.html


[5] 多集群应用下发:

https://help.aliyun.com/document_detail/419336.html


[6] 使用 ACK One 构建应用系统的两地三中心容灾方案:

https://help.aliyun.com/document_detail/427364.html


如您想要了解更多关于 ACK One 的信息 ,欢迎钉钉搜索群号:35688562 进群交流。

相关实践学习
通过Ingress进行灰度发布
本场景您将运行一个简单的应用,部署一个新的应用用于新的发布,并通过Ingress能力实现灰度发布。
容器应用与集群管理
欢迎来到《容器应用与集群管理》课程,本课程是“云原生容器Clouder认证“系列中的第二阶段。课程将向您介绍与容器集群相关的概念和技术,这些概念和技术可以帮助您了解阿里云容器服务ACK/ACK Serverless的使用。同时,本课程也会向您介绍可以采取的工具、方法和可操作步骤,以帮助您了解如何基于容器服务ACK Serverless构建和管理企业级应用。 学习完本课程后,您将能够: 掌握容器集群、容器编排的基本概念 掌握Kubernetes的基础概念及核心思想 掌握阿里云容器服务ACK/ACK Serverless概念及使用方法 基于容器服务ACK Serverless搭建和管理企业级网站应用
相关文章
|
11天前
|
Kubernetes 算法 调度
阿里云 ACK FinOps成本优化最佳实践
本文源自2024云栖大会梁成昊演讲,讨论了成本优化策略的选择与实施。文章首先介绍了成本优化的基本思路,包括优化购买方式、调整资源配置等基础策略,以及使用弹性、资源混部等高级策略。接着,文章详细探讨了集群优化和应用优化的具体方法,如使用抢占式实例降低成本、通过资源画像识别并优化资源配置,以及利用智能应用弹性策略提高资源利用效率。
|
11天前
|
弹性计算 调度 数据中心
阿里云 ACK One 注册集群云上弹性:扩展业务新利器
随着企业数字化转型深入,传统IDC数据中心因物理容量限制,难以实现动态扩容,缺乏弹性能力。阿里云ACK One注册集群凭借其高度灵活性和丰富资源选择,成为解决此问题的最佳方案。通过与阿里云资源的整合,ACK One不仅实现了计算资源的按需扩展,提高了资源利用率,还通过按需付费模式降低了成本,使企业能够更高效地应对业务增长和高峰需求。
|
11天前
|
运维 Kubernetes Serverless
阿里云Argo X K8s玩转工作流引擎,实现大规模并行计算
本文基于2024云栖大会田双坤的演讲,介绍了Kubernetes作为云原生操作系统的角色及其在各类任务中的应用,重点探讨了Argo Workflows在Kubernetes上编排并行任务的能力。面对自建Argo Workflows的挑战,如稳定性、成本和安全性等问题,阿里巴巴云推出了全托管的Serverless Argo工作流,提供全托管、免运维、可观测和易集成的特点,显著提升了任务编排的效率和稳定性。适用于数据处理、科学计算、自动驾驶仿真等多个领域。
|
11天前
|
Kubernetes 容灾 调度
阿里云 ACK 高可用稳定性最佳实践
本文整理自2024云栖大会刘佳旭的演讲,主题为《ACK高可用稳定性最佳实践》。文章探讨了云原生高可用架构的重要性,通过Kubernetes的高可用案例分析,介绍了ACK在单集群高可用架构设计、产品能力和最佳实践方面的方法,包括控制面和数据面的高可用策略、工作负载高可用配置、企业版容器镜像服务高可用配置等内容,旨在帮助企业构建更加可靠和高效的应用运行环境。
|
7月前
|
人工智能 运维 Kubernetes
阿里云容器服务ACK AI助手正式上线带来的便利性
作为开发者想必大家都知道,云原生容器技术的优势,尤其是近两年的随着容器技术的迅猛发展,Kubernetes(K8s)已成为广泛应用于容器编排和管理的领先解决方案,但是K8s的运维复杂度一直是挑战之一。为了应对这一问题,就在最近,阿里云容器服务团队正式发布了ACK AI助手,这是一款旨在通过大模型增强智能诊断的产品,旨在帮助企业和开发者降低Kubernetes(K8s)的运维复杂度。那么本文就来详细讲讲关于这款产品,让我们结合实际案例分享一下K8s的运维经验,探讨ACK AI助手能否有效降低K8s的运维复杂度,并展望ACK AI助手正式版上线后的新功能。
365 2
阿里云容器服务ACK AI助手正式上线带来的便利性
|
7月前
|
存储 Kubernetes Docker
容器服务ACK常见问题之阿里云控制台进不去了如何解决
容器服务ACK(阿里云容器服务 Kubernetes 版)是阿里云提供的一种托管式Kubernetes服务,帮助用户轻松使用Kubernetes进行应用部署、管理和扩展。本汇总收集了容器服务ACK使用中的常见问题及答案,包括集群管理、应用部署、服务访问、网络配置、存储使用、安全保障等方面,旨在帮助用户快速解决使用过程中遇到的难题,提升容器管理和运维效率。
|
7月前
|
人工智能 弹性计算 调度
阿里云容器服务 ACK 产品技术动态(202312)
容器服务 Kubernetes 版 ACK 【新功能】 Feature:支持基于机密虚拟机的 AI 模型推理保护 ACK 现已支持将基于 Intel® Trusted Domain Extension(Intel® TDX)技术的 ECS 实例加入 TDX 机密虚拟机计算节点池,使集群具备 TDX 机密计算能力,实现 AI 模型的可信推理和微调,保障模型数据的机密性与完整性。结合 PyTorch 与 Intel® AMX指令集,您可以在 32 核实例上实现秒级出图的推理能力。
510 1
|
11天前
|
运维 Kubernetes 调度
阿里云容器服务 ACK One 分布式云容器企业落地实践
阿里云容器服务ACK提供强大的产品能力,支持弹性、调度、可观测、成本治理和安全合规。针对拥有IDC或三方资源的企业,ACK One分布式云容器平台能够有效解决资源管理、多云多集群管理及边缘计算等挑战,实现云上云下统一管理,提升业务效率与稳定性。
|
3月前
|
运维 Kubernetes 调度
阿里云容器服务 ACK One 分布式云容器企业落地实践
3年前的云栖大会,我们发布分布式云容器平台ACK One,随着3年的发展,很高兴看到ACK One在混合云,分布式云领域帮助到越来越多的客户,今天给大家汇报下ACK One 3年来的发展演进,以及如何帮助客户解决分布式领域多云多集群管理的挑战。
阿里云容器服务 ACK One 分布式云容器企业落地实践
|
3月前
|
人工智能 Prometheus 监控
使用 NVIDIA NIM 在阿里云容器服务(ACK)中加速 LLM 推理
本文介绍了在阿里云容器服务 ACK 上部署 NVIDIA NIM,结合云原生 AI 套件和 KServe 快速构建高性能模型推理服务的方法。通过阿里云 Prometheus 和 Grafana 实现实时监控,并基于排队请求数配置弹性扩缩容策略,提升服务稳定性和效率。文章提供了详细的部署步骤和示例,帮助读者快速搭建和优化模型推理服务。
201 7
使用 NVIDIA NIM 在阿里云容器服务(ACK)中加速 LLM 推理

相关产品

  • 容器服务Kubernetes版
  • 下一篇
    DataWorks