阿里云 ACK One 多集群管理全面升级:多集群服务、多集群监控、两地三中心应用容灾

本文涉及的产品
性能测试 PTS,5000VUM额度
注册配置 MSE Nacos/ZooKeeper,118元/月
云原生网关 MSE Higress,422元/月
简介: 本文介绍了 ACK One 近期发布的 3 个主要特性,覆盖了多集群管理的 3 个主要场景,跨集群服务发现与访问、多集群全局监控、应用容灾。除多集群管理外,ACK One 更是支持连接并管理任何地域、任何基础设施上的 Kubernetes 集群,提供一致的管理和社区兼容的 API,支持对计算、网络、存储、安全、监控、日志、作业、应用、流量等进行统一运维管控。

作者:宇汇


ACK One 概述


ACK One 是阿里云面向混合云、多集群、分布式计算等场景推出的分布式云容器平台,能够统一管理阿里云上、边缘、部署在客户数据中心以及其他云上的 Kubernetes 集群,并简化集群管理界面,让企业轻松应对多集群形态,从而灵活地根据自身业务和数据管控等需求,同时使部署在客户数据中心的集群也能获取云上弹性算力,实现“计算无界”。


1.png


三大重磅特性,覆盖三大场景,引领多集群管理新高度


多集群服务 -- 跨集群服务发现与访问


  • 概述
     

使用 Kubernetes 原生的 Service,可以方便地在集群内发现和访问 Service,但无法实现跨集群的 Service 发现与访问。随着业务的发展,应用往往需要多集群部署,实现隔离性,高可用性,例如:多个开发生产集群,不同业务不同集群,不同组织维护的集群,以解决可用性和数据所有权要求,灵活分账等需求。同时,不同业务应用间需要相互访问,因此需要一个跨集群 Service 方案,应对多集群带来的挑战。


ACK One 多集群管理发布新特性多集群服务,通过多集群服务实现 Kubernetes 原生 Service 的跨集群访问,打破了多集群服务访问的边界。


  • 场景一:跨集群服务发现与访问
     

2.png


ACK One 多集群服务支持 Kubernetes 社区多集群服务 API 标准,通过 ServiceExport、ServiceImport 对象实现跨集群的服务发现与访问。


1. 如图中链路 0 所示:管理员通过主控实例下发应用、多集群服务 ServiceExport、ServiceImport、分发规则等资源。


2. 如图中链路 1 所示:主控实例将应用和多集群服务资源,根据分发规则下发到关联集群中。


a.通过向 ACK Cluster 1 下发 ServiceExport 资源,定义 ACK Cluster 1 为服务提供者。


b.通过向 ACK Cluster 2 下发 ServiceImport 资源,定义 ACK Cluster 2 为服务消费者。 


3. 如图中链路 2 所示:ACK Cluster 2 上的 Client Pod 可以访问 ACK Cluster 1 上的 Service 1。


  • 场景二:多集群服务高可用

3.png


1. 如图中链路 0 所示:管理员通过主控实例下发应用、多集群服务 ServiceExport、ServiceImport、分发规则等资源。


2. 如图中链路 1 所示:


a.通过 ACK One 主控实例,将服务 Service1 同时部署在 ACK Cluster 1 和 ACK Cluster 3 中,实现高可用部署。


b.通过向 ACK Cluster 1 和 ACK Cluster 3 下发 ServiceExport 资源,定义 ACK Cluster 1 和 ACK Cluster 3 为服务提供者。


c.通过向 ACK Cluster 2 下发 ServiceImport 资源,定义 ACK Cluster 2 为服务消费者。


3. 如图中链路 2 所示:ACK Cluster 2 上的 Client Pod 可以负载均衡的访问 ACK Cluster 1 和 ACK Cluster 3 上的 Service 1。


  • 多集群服务方案优势
     

相比 LoadBalance/Ingress 等传统的 Kubernetes 服务跨集群暴露方案,ACK One 多集群服务不需要引入额外的负载均衡资源,仅通过定义服务提供者,消费者,即可实现跨集群的服务发现与访问。


相比服务网格的多集群服务方案,ACK One 多集群服务的实现非常轻量,不需要引入 sidecar 容器,没有额外的网络延时。同时,ACK One 多集群服务是托管在 ACK One 控制面的,省去运维成本。


详细请参见文末:多集群服务。


多集群全局监控 -- 运维利器,全局监控大盘


  • 概述
     

Prometheus 监控是 Kubernetes 集群监控的事实标准,在 ACK 容器服务中可以安装 Prometheus 监控组件,快速实现 ACK 集群监控,ACK 容器服务同时提供了大量的使用的监控大盘。但在多集群场景中,用户不得不单独维护每个集群的 Prometheus 监控组件。日常的运维中,需要频繁切换不同集群的监控大盘,在问题诊断中需要手工对比对各集群监控指标的差异。


4.png


ACK One 多集群全局监控基于单集群 Prometheus 的监控指标,通过多集群监控聚合实例汇总多个集群的监控指标,并提供多集群视角的全局监控大盘,让您可以在一个监控大盘上同时获取多个集群的监控指标,方便日常的运维工作。


  • 全局监控大盘
     

5.png


目前支持的大盘包括:全局集群无状态应用监控,TopN 全局集群节点监控,TopN 全局集群 Pod 监控。同时,ACK One 全局监控支持自定义监控大盘,您可以通过聚合实例构建自己的多集群监控大盘。


详细请参见文末:多集群全局监控。


多集群两地三中心应用部署 -- 应用容灾新选择


  • 概述
     

两地三中心是指在两个城市部署三个业务处理中心,即:生产中心、同城容灾中心、异地容灾中心。在一个城市部署 2 套环境形成同城双中心,同时处理业务并通过高速链路实现数据同步,可切换运行。在另一城市部署 1 套环境做异地灾备中心,做数据备份,当双中心同时故障时,异地灾备中心可切换处理业务。两地三中心容灾方案可以极大程度的保证业务的连续运行。


  • 方案架构


6.png


使用 ACK One 的多集群管理应用分发功能,可以帮助企业统一管理 3 个 K8s 集群,实现应用在 3 个 K8s 集群快速部署升级,同时实现应用在 3 个 K8s 集群上的差异化配置。配合使用 GTM(全局流量管理)可以实现在故障发生时业务流量在 3 个 K8s 集群的自动切换。对 RDS 数据层面的数据复制,可参考 DTS 数据传输服务。


详细请参见文末:使用 ACK One 构建应用系统的两地三中心容灾方案。

总结


本文介绍了 ACK One 近期发布的 3 个主要特性,覆盖了多集群管理的 3 个主要场景,跨集群服务发现与访问、多集群全局监控、应用容灾。除多集群管理外,ACK One 更是支持连接并管理任何地域、任何基础设施上的 Kubernetes 集群,提供一致的管理和社区兼容的 API,支持对计算、网络、存储、安全、监控、日志、作业、应用、流量等进行统一运维管控。阿里云分布式云容器平台(简称 ACK One)是面向混合云、多集群、分布式计算、容灾等场景推出的企业级云原生平台。


分布式云容器平台 ACK One 产品免费公测中,欢迎点击此处前往 ACK One 产品详情页开通体验。


参考链接:


[1] 分布式云容器平台 ACK One:

https://www.aliyun.com/product/aliware/adcp


[2] ACK One 产品控制台:

https://cs.console.aliyun.com/one


[3] 多集群服务:

https://help.aliyun.com/document_detail/440680.html


[4] 多集群全局监控:

https://help.aliyun.com/document_detail/434106.html


[5] 多集群应用下发:

https://help.aliyun.com/document_detail/419336.html


[6] 使用 ACK One 构建应用系统的两地三中心容灾方案:

https://help.aliyun.com/document_detail/427364.html


如您想要了解更多关于 ACK One 的信息 ,欢迎钉钉搜索群号:35688562 进群交流。

相关实践学习
通过Ingress进行灰度发布
本场景您将运行一个简单的应用,部署一个新的应用用于新的发布,并通过Ingress能力实现灰度发布。
容器应用与集群管理
欢迎来到《容器应用与集群管理》课程,本课程是“云原生容器Clouder认证“系列中的第二阶段。课程将向您介绍与容器集群相关的概念和技术,这些概念和技术可以帮助您了解阿里云容器服务ACK/ACK Serverless的使用。同时,本课程也会向您介绍可以采取的工具、方法和可操作步骤,以帮助您了解如何基于容器服务ACK Serverless构建和管理企业级应用。 学习完本课程后,您将能够: 掌握容器集群、容器编排的基本概念 掌握Kubernetes的基础概念及核心思想 掌握阿里云容器服务ACK/ACK Serverless概念及使用方法 基于容器服务ACK Serverless搭建和管理企业级网站应用
相关文章
|
1月前
|
供应链 安全 Cloud Native
阿里云飞天企业版获【可信云·容器平台安全能力】先进级认证
阿里云飞天企业版容器系列产品获中国信息通信研究院【可信云·容器平台安全能力】先进级认证,这是飞天企业版容器产品获得《等保四级PaaS平台》和《 云原生安全配置基线规范V2.0》之后,本年度再一次获得行业权威认可,证明飞天企业版的容器解决方案具备符合行业标准的最高等级容器安全能力。
阿里云飞天企业版获【可信云·容器平台安全能力】先进级认证
|
1月前
|
缓存 Kubernetes Docker
GitLab Runner 全面解析:Kubernetes 环境下的应用
GitLab Runner 是 GitLab CI/CD 的核心组件,负责执行由 `.gitlab-ci.yml` 定义的任务。它支持多种执行方式(如 Shell、Docker、Kubernetes),可在不同环境中运行作业。本文详细介绍了 GitLab Runner 的基本概念、功能特点及使用方法,重点探讨了流水线缓存(以 Python 项目为例)和构建镜像的应用,特别是在 Kubernetes 环境中的配置与优化。通过合理配置缓存和镜像构建,能够显著提升 CI/CD 流水线的效率和可靠性,助力开发团队实现持续集成与交付的目标。
|
5天前
|
Cloud Native Serverless 数据中心
阿里云ACK One:注册集群支持ACS算力——云原生时代的计算新引擎
ACK One注册集群已正式支持ACS(容器计算服务)算力,为企业的容器化工作负载提供更多选择和更强大的计算能力。
|
27天前
|
存储 监控 对象存储
ACK 容器监控存储全面更新:让您的应用运行更稳定、更透明
针对本地存储和 PVC 这两种容器存储使用方式,我们对 ACK 的容器存储监控功能进行了全新升级。此次更新完善了对集群中不同存储类型的监控能力,不仅对之前已有的监控大盘进行了优化,还针对不同的云存储类型,上线了全新的监控大盘,确保用户能够更好地理解和管理容器业务应用的存储资源。
113 23
|
1月前
|
存储 监控 对象存储
ACK容器监控存储全面更新:让您的应用运行更稳定、更透明
介绍升级之后的ACK容器监控体系,包括各大盘界面展示和概要介绍。
|
2月前
|
Prometheus Kubernetes 监控
OpenAI故障复盘 - 阿里云容器服务与可观测产品如何保障大规模K8s集群稳定性
聚焦近日OpenAI的大规模K8s集群故障,介绍阿里云容器服务与可观测团队在大规模K8s场景下我们的建设与沉淀。以及分享对类似故障问题的应对方案:包括在K8s和Prometheus的高可用架构设计方面、事前事后的稳定性保障体系方面。
|
2月前
|
Kubernetes 算法 调度
阿里云 ACK FinOps成本优化最佳实践
本文源自2024云栖大会梁成昊演讲,讨论了成本优化策略的选择与实施。文章首先介绍了成本优化的基本思路,包括优化购买方式、调整资源配置等基础策略,以及使用弹性、资源混部等高级策略。接着,文章详细探讨了集群优化和应用优化的具体方法,如使用抢占式实例降低成本、通过资源画像识别并优化资源配置,以及利用智能应用弹性策略提高资源利用效率。
|
存储 设计模式 运维
YAML 管理 Kubernetes 应用
YAML 管理 Kubernetes 应用
364 1
|
存储 设计模式 运维
如何不编写 YAML 管理 Kubernetes 应用?
Kubernetes 将自身边界内的事物都抽象为资源。其中的主要部分,是以 Deployment、StatefulSet 为代表的 workload 工作负载控制器,其他各类资源都围绕这些主要的资源工作。这些资源合并起来,可以为 IT 技术工作者展现出一个以 workload 为中心的模型。Kubernetes 中所有的资源,都通过声明式配置文件来编辑描述,一条条的 Yaml 字段定义,给了 IT 技术人员最大的自由度的同时,也对技术人员的能力提出了极高的要求。
|
Kubernetes Shell 开发工具
使用 Kustomize 帮你管理 kubernetes 应用(二): Kustomize 的使用方法
本篇为系列文章第二篇,手把手教你使用 Kustomize 的两种方式。
4602 0

相关产品

  • 容器服务Kubernetes版