K8s多集群管理:选对方法,为K8s集群赋能

简介: 阿里云容器服务团队在2019年推出注册集群,随着几年的发展,注册集群已经在多个行业和众多客户中应用,为K8s集群全面赋能,提供一站式的控制台体验,运维能力和云上弹性扩展能力,帮助您高效管理不同供应商和不同位置的K8s集群。

【阅读原文】戳:K8s多集群管理:选对方法,为K8s集群赋能

K8s多集群的发展与挑战

 

 

随着业务的逐步发展,企业需要部署维护多个K8s集群,以满足业务就近部署、隔离、容量和容灾的需求。由于各种原因,这些集群可能来自不同的提供商,例如不同公共云的提供商,不同私有化集群提供商。虽然K8s集群本身符合开源标准保持一致性,但围绕集群的周边运维能力和安全能力却千差万别,因此这些来自不同提供商和不同位置的K8s集群,给企业日常维护工作流带来了极大的挑战,影响了K8s集群的易用性,稳定性和安全性。

 

1. 不同的可观测工具(监控、事件、日志、告警),日常学习和运维工作量加倍,遗漏出错风险高。

 

2. 不同的安全能力(高危容器告警,策略管理,配置巡检),安全水位不一致,风险高。

 

3. 不同的用户认证权限管理与过期机制,配置使用复杂,极易引起安全漏洞。

 

4. 不同的集群控制台,用户体验差异大,日常使用成本高。

 

对自建K8s集群的企业,另一个挑战来自于IDC缺乏IaaS资源弹性,例如服务器采购时间长、GPU服务器供应紧张,无法应对业务的快速增长,无法平衡资源成本与业务的波峰波谷。

 

为了应对以上挑战,阿里云容器服务团队在2019年推出注册集群,随着几年的发展,注册集群已经在多个行业和众多客户中应用,为K8s集群全面赋能,提供一站式的控制台体验,运维能力和云上弹性扩展能力,帮助您高效管理不同供应商和不同位置的K8s集群。

 

 

 

 

ACK One注册集群赋能非阿里云K8s集群,实现一站式多集群统一管理

 

 

 

ACK One注册集群是阿里云容器服务ACK提供的一种集群类型,通过ACK One注册集群,您可以将来自不同提供商和不同位置的K8s集群接入到阿里云容器服务ACK控制台,提供与ACK集群一致的管理能力,在DevOps、微服务治理、可观测、安全、容灾和集群资源弹性等方面,为您的K8s集群全面赋能。

 

 

 

架构设计

 

1. 非阿里云K8s集群接入注册集群

 

创建ACK One注册集群后,在K8s集群中安装Agent connector组件,connector会与注册集群建立连接。之后用户通过ACK控制台对注册集群的操作,会通过connector转发给K8s集群的API Server,例如:获取集群状态,安装ACK组件等。

 

2. ACK组件实现能力扩展

 

非阿里云K8s集群接入注册集群后,扩展能力众多,可根据具体需求,安装相应ACK组件,以开启云上弹性、运维、安全等能力。

 

3. 安全保证

 

a. 提供公网和内网专线两种连接方式,并支持TLS加密。

 

b. 集群接入可选择普通模式或受限模式:

 

普通模式:ACK控制台能力可以正常使用,包括:workload管理,运维能力,安全能力。

 

受限模式:收敛Agent Connector的所有RBAC权限,ACK控制台能力受限,可以开启集群云上弹性能力。

 

c. 注册集群 Agent Connector 开源,保证透明性,开源项目地址为:

 

https://github.com/AliyunContainerService/alibabacloud-ack-connector

 

 

核心功能

 

1. 一致的运维体验

 

K8s集群统一运维管理,提供与ACK集群一致的运维体验,集成阿里云ARMS、SLS和安全中心。非阿里云K8s集群接入 ACK One 注册集群后,可以使用 ACK 控制台统一管理,包括:权限,日志,监控,事件,告警,成本分析,安全巡检,安全策略等。

 

 

2. 云上弹性,弹性扩容IDC自建K8s集群Worker资源

 

当本地IDC中的K8s集群资源不足时,结合阿里云ACK调度器,按优先级扩容弹性扩容阿里云 ECS 节点池,扩容ECI 弹性容器实例。同时,支持逆向缩容,优先缩容云上资源,应对业务流量的波峰波谷,节省资源成本。

 

 

3. 备份容灾

 

提供云上备份、恢复、迁移一体化的方案,支持数据和应用的云容灾,全面提升企业的业务连续性。

 

 

 

 

客户应用与总结

 

 

使用 ACK One 注册集群,可以轻松实现阿里云 ACK 集群和非 ACK 集群(他云和IDC自建 K8s 集群)的统一管理。目前已经在互联网,通信设备,自动驾驶,生物医药,智能制造,基因科技,物流,汽车等领域的大量企业落地应用,欢迎大家使用,任何问题您可以加入“ACK One 客户交流群”讨论(钉钉群号:35688562)。

 

 

了解更多:

 

[1] 注册集群概述:

https://help.aliyun.com/zh/ack/distributed-cloud-container-platform-for-kubernetes/user-guide/overview-9

 

[2] 注册集群云上弹性:

https://help.aliyun.com/zh/ack/distributed-cloud-container-platform-for-kubernetes/user-guide/auto-scaling-1

 

[3] 注册集群可观测性:

https://help.aliyun.com/zh/ack/distributed-cloud-container-platform-for-kubernetes/user-guide/observability-of-external-clusters

 

[4] 注册集群备份中心:

https://help.aliyun.com/zh/ack/distributed-cloud-container-platform-for-kubernetes/user-guide/backup-center-overview


我们是阿里巴巴云计算和大数据技术幕后的核心技术输出者。

欢迎关注 “阿里云基础设施”同名微信微博知乎

获取关于我们的更多信息~

相关实践学习
深入解析Docker容器化技术
Docker是一个开源的应用容器引擎,让开发者可以打包他们的应用以及依赖包到一个可移植的容器中,然后发布到任何流行的Linux机器上,也可以实现虚拟化,容器是完全使用沙箱机制,相互之间不会有任何接口。Docker是世界领先的软件容器平台。开发人员利用Docker可以消除协作编码时“在我的机器上可正常工作”的问题。运维人员利用Docker可以在隔离容器中并行运行和管理应用,获得更好的计算密度。企业利用Docker可以构建敏捷的软件交付管道,以更快的速度、更高的安全性和可靠的信誉为Linux和Windows Server应用发布新功能。 在本套课程中,我们将全面的讲解Docker技术栈,从环境安装到容器、镜像操作以及生产环境如何部署开发的微服务应用。本课程由黑马程序员提供。     相关的阿里云产品:容器服务 ACK 容器服务 Kubernetes 版(简称 ACK)提供高性能可伸缩的容器应用管理能力,支持企业级容器化应用的全生命周期管理。整合阿里云虚拟化、存储、网络和安全能力,打造云端最佳容器化应用运行环境。 了解产品详情: https://www.aliyun.com/product/kubernetes
相关文章
|
5月前
|
资源调度 Kubernetes 调度
从单集群到多集群的快速无损转型:ACK One 多集群应用分发
ACK One 的多集群应用分发,可以最小成本地结合您已有的单集群 CD 系统,无需对原先应用资源 YAML 进行修改,即可快速构建成多集群的 CD 系统,并同时获得强大的多集群资源调度和分发的能力。
205 9
|
5月前
|
资源调度 Kubernetes 调度
从单集群到多集群的快速无损转型:ACK One 多集群应用分发
本文介绍如何利用阿里云的分布式云容器平台ACK One的多集群应用分发功能,结合云效CD能力,快速将单集群CD系统升级为多集群CD系统。通过增加分发策略(PropagationPolicy)和差异化策略(OverridePolicy),并修改单集群kubeconfig为舰队kubeconfig,可实现无损改造。该方案具备多地域多集群智能资源调度、重调度及故障迁移等能力,帮助用户提升业务效率与可靠性。
|
7月前
|
存储 Kubernetes 监控
K8s集群实战:使用kubeadm和kuboard部署Kubernetes集群
总之,使用kubeadm和kuboard部署K8s集群就像回归童年一样,简单又有趣。不要忘记,技术是为人服务的,用K8s集群操控云端资源,我们不过是想在复杂的世界找寻简单。尽管部署过程可能遇到困难,但朝着简化复杂的目标,我们就能找到意义和乐趣。希望你也能利用这些工具,找到你的乐趣,满足你的需求。
676 33
|
7月前
|
Kubernetes 开发者 Docker
集群部署:使用Rancher部署Kubernetes集群。
以上就是使用 Rancher 部署 Kubernetes 集群的流程。使用 Rancher 和 Kubernetes,开发者可以受益于灵活性和可扩展性,允许他们在多种环境中运行多种应用,同时利用自动化工具使工作负载更加高效。
384 19
|
7月前
|
人工智能 分布式计算 调度
打破资源边界、告别资源浪费:ACK One 多集群Spark和AI作业调度
ACK One多集群Spark作业调度,可以帮助您在不影响集群中正在运行的在线业务的前提下,打破资源边界,根据各集群实际剩余资源来进行调度,最大化您多集群中闲置资源的利用率。
|
11月前
|
Kubernetes 持续交付 开发者
探索并实践Kubernetes集群管理与自动化部署
探索并实践Kubernetes集群管理与自动化部署
402 93
|
7月前
|
Kubernetes Shell Windows
【Azure K8S | AKS】在AKS的节点中抓取目标POD的网络包方法分享
在AKS中遇到复杂网络问题时,可通过以下步骤进入特定POD抓取网络包进行分析:1. 使用`kubectl get pods`确认Pod所在Node;2. 通过`kubectl node-shell`登录Node;3. 使用`crictl ps`找到Pod的Container ID;4. 获取PID并使用`nsenter`进入Pod的网络空间;5. 在`/var/tmp`目录下使用`tcpdump`抓包。完成后按Ctrl+C停止抓包。
236 12
|
10月前
|
Prometheus Kubernetes 监控
OpenAI故障复盘 - 阿里云容器服务与可观测产品如何保障大规模K8s集群稳定性
聚焦近日OpenAI的大规模K8s集群故障,介绍阿里云容器服务与可观测团队在大规模K8s场景下我们的建设与沉淀。以及分享对类似故障问题的应对方案:包括在K8s和Prometheus的高可用架构设计方面、事前事后的稳定性保障体系方面。
|
7月前
|
人工智能 运维 Kubernetes
2025 超详细!Lens Kubernetes IDE 多平台下载安装与集群管理教程
Lens 是一款企业级 Kubernetes 可视化操作平台,2025版实现了三大技术革新:AI智能运维(异常检测准确率98.7%)、多云联邦管理(支持50+集群)和实时3D拓扑展示。本文介绍其安装环境、配置流程、核心功能及高阶技巧,帮助用户快速上手并解决常见问题。适用于 Windows、macOS 和 Ubuntu 系统,需满足最低配置要求并前置依赖组件如 kubectl 和 Helm。通过 Global Cluster Hub 实现多集群管理,AI辅助故障诊断提升运维效率,自定义监控看板和插件生态扩展提供更多功能。
|
7月前
|
Prometheus Kubernetes 监控
OpenAI故障复盘丨如何保障大规模K8s集群稳定性
OpenAI故障复盘丨如何保障大规模K8s集群稳定性
226 0
OpenAI故障复盘丨如何保障大规模K8s集群稳定性

热门文章

最新文章

推荐镜像

更多