【阅读原文】戳:ACK One多集群Service帮助大批量应用跨集群无缝迁移
概述
在云原生时代,应用的快速迭代和灵活部署至关重要。而随着业务的变化与发展,在Kubernetes集群间迁移应用常有发生,往往发生在诸如跨云搬迁、平台重大升级、资源规划变更等场景下。将大批量应用从一个集群迁移到另一个集群,常常面临巨大挑战:复杂的迁移流程、十分长的迁移周期、不可控的迁移风险。
所以在需要进行跨集群迁移大批量应用时,客户通常希望:
• 可以平滑迁移、不停机;
• 将迁移的风险降至最低。
ACK One多集群Service,可以让大批量应用跨集群迁移变得更简单,可以实现无缝迁移,无需关注服务间的依赖,并最小化迁移风险。
ACK One多集群Service
分布式云容器平台ACK One[1]是阿里云面向混合云、多集群、分布式计算、容灾等场景推出的企业级分布式云容器平台,提供多集群统一管理能力。通过ACK One注册集群[2]将您的其他公共云厂商和IDC K8s集群接入到阿里云容器服务ACK控制台,并由舰队对这些注册集群以及云上的ACK、ACK Edge集群进行多集群统一的应用分发、流量管理、可观测运维管理、安全管理等。
ACK One多集群Service[3]可实现多个Kubernetes集群间的服务跨集群访问,让您在多集群场景下,拥有与单个Kuberentes集群中相同的服务发现体验,在应用迁移、解耦有状态服务和无状态服务(隔离后易于管理)等场景下具有显著效果。
ACK One多集群Service,通过MultiClusterService CRD实现了通过原生Kubernetes Service的Name/域名跨集群访问服务,在不需要修改业务代码、业务Pod dnsconfig、coredns配置的情况下,直接访问原生Service即可实现跨集群流量路由。其架构如下图所示:
• 用户仅需在舰队中创建MultiClusterService,并在Cosumer Cluster中创建同名Service,即可实现Cosumer Cluster使用原生Service Name跨集群访问到Provider Cluster上的该Service。
MultiClusterService API很简单,仅需提供Provider和Consumer Clusters,即可实现与之同名的Service可通过原生Service Name/域名跨集群服务。yaml如下所示:
• name和namespace保持和要处理的service一致;
• providerClusters:指要提供该service被其他集群访问的集群列表;
• consumerClusters:指要访问该service的集群列表。
一个集群可以同时是consumer cluster和provider cluster
apiVersion: networking.one.alibabacloud.com/v1alpha1 kind: MultiClusterService metadata: name: service namespace: demo spec: consumerClusters: - name: <your consumer cluster id> providerClusters: - name: <your provider cluster id>
基于ACK One多集群Service的跨集群应用迁移方案
在阿里云容器服务ACK上,实现跨Kubernetes集群应用迁移,有以下两个方案:
1. 搬迁旧集群完整环境到新集群,一次性全量迁移;
2. 基于ACK One多集群Service,实现跨集群服务双向互通,分批迁移。
搬迁旧集群完整环境到新集群方案,适合应用数量之间依赖极少的场景。它在应用数量庞大(几百上千个应用),依赖关系复杂、且无法理清的情况下,存在一些不足:
1. 应用数量庞大,完整验证的工作量巨大,迁移周期会非常长;
2. 一次性迁移的风险不可控,而依赖关系复杂、且无法理清;
3. 如果不同应用分属不同团队,他们的迁移计划和速度不一致,也可能会导致迁移过程中服务中断和停机。
基于ACK One多集群Service的MultiClusterService实现的跨集群应用迁移方案,主要是基于MultiClusterService提供的跨集群服务互访能力,进而分批迁移应用,无需关注应用间的依赖关系,直至所有应用迁移成功。
该迁移方案可实现大批量应用跨集群无缝迁移,具有以下优势:
1. 最小化迁移风险:由于ACK One多集群Service的能力,无需关注应用间的依赖关系,可分批迁移,最小化迁移风险,风险可控,可快速回滚;
2. 无损:该方案不会拦截业务流量,不会造成流量异常,也无需担心业务外的性能影响;无需修改业务代码、业务Pod dnsconfig、coredns配置等。
应用在跨集群迁移过程中,往往会由于应用/服务众多、服务间依赖关系难以理清,让整个迁移过程持续较长周期。所以基于ACK One多集群Service的迁移方案是:
1. 通过MultiClusterService实现Old Cluster和New Cluster双向跨集群服务访问(通过service域名访问);
2. 然后逐步分批迁移应用(随机选择若干应用进行迁移);
3. 直至所有应用都迁移到New Cluster,之后将所有外部流量切换到New Cluster,完成整个迁移过程。
基于ACK One MultiClusterService的跨集群应用迁移方案如下所示(本文以3个backend service为例,用Client Pod来进行验证):
1. 将Old Cluster和New Cluster关联到ACK One舰队;
2. 将Old Cluster中所有service资源都部署到New Cluster中,并为所有Service在舰队中创建MultiClusterService(每个Service对应一个同名的MultiClusterService);
a. 资源部署可以自行apply,也可以使用ACK One的应用分发和GitOps能力。
3. 从Old Cluster中随机选择一批要迁移的服务,如图中的Service3,将其Deployment部署到New Cluster中;
4. 此时Service2会有部分流量打到New Cluster的Service3后端,如验证无问题,则缩容这批服务(这里的Service3)的Deployment replicas为0,保证上游服务只访问New Cluster中服务(Service3)。
a. 若验证New Cluster中的Service3有问题,则缩容New Cluster的Deployment replicas为0,修复后再扩容replicas。
5. 重复3~4,继续迁移下一批服务,直至所有要迁移的服务完成;
6. 最后迁移Front Service1后将流量完全切换到New Cluster。
总结
综上所述,ACK One多集群Service可以帮助您,在无需关注服务间的依赖,和最小化迁移风险的前提下,完成跨集群无缝迁移大批量应用。更多内容可详见ACK One多集群Service迁移场景最佳实践[4]。
欢迎加入ACK One客户交流钉钉群,与我们一同交流。(钉钉群号:35688562)
相关链接:
[1] 分布式云容器平台ACK One
[2] ACK One注册集群
[3] ACK One多集群Service
[4] ACK One多集群Service迁移场景最佳实践
我们是阿里巴巴云计算和大数据技术幕后的核心技术输出者。
获取关于我们的更多信息~