阿里云操作系统迁移最佳实践|飞天技术沙龙-CentOS 迁移替换专场
内容介绍
1. CentOS 迁移背景
2. 操作系统迁移实践
3. 迁移故障处理
01. CentOS 迁移背景
CentOS 在 2020 年底官方宣布了停止维护,我们就开启了 CentOS 迁移替换相对应的措施和计划, 2024 年 6 月 31 日后,主流的 CentOS 系统将全部结束生命周期,不再提供软件更新和安全补丁,这样我们现在存量的 CentOS 服务器操作系统将面临一个巨大的风险,没有官方的操作系统的更新和维护。大家对于操作系统安全性的要求是非常高的,这个节点针对 CentOS 替换的需求也是越来越紧迫,上图右侧是阿里云上的服务器实例在控制台上展示的界面,针对所有 CentOS 的操作系统的实例,都会提示他们可以用我们操作系统替换的方案,迁移到 Alibaba Cloud Linux 或者龙蜥操作系统上。
无论是 Alibaba Cloud Linux 、阿里云服务器操作系统还是龙蜥社区操作系统,都有一个 10 年的操系统维护周期,当 CentOS 最后一个版本的操作系统在 6 月底停止服务之后,我们建议所有的云上操作系统用户能够迁移到 Alibaba Cloud Linux 和龙蜥操作系统上,应对这样的方案,我们提供了一系列的产品和方案来解决这个问题。
Alibaba Cloud Linux 3 和龙蜥操作系统 8 针对 CentOS 8 和 RHEL 8 的生态是完全兼容的。 Alibaba Cloud Linux 2 和龙蜥操作系统 7 针对 CentOS 7 和 RHEL 7 的生态是兼容的。所以很方便进行迁移替换,对于企业的运维人员以及企业操作系统的使用者,相对简化了他们的维护成本。
关于操作系统的迁移方案主要有两个,分别是轮转迁移和原地迁移。轮转迁移的方式相当于是一种重新部署的方式,适用于对操系统底层包括内核、驱动、 C++ 技术战略的应用等比较敏感的场景,这种情况类似于容器节点操作的替换,适合重新部署一个新的操作系统,当部署了一个新的操作系统节点,把运行在旧操作系统上的应用和业务迁移到新的系统上之后,确保兼容性应用以及跑起来性能方面没有问题,可以把旧的节点进行下线,这种就相当于是一个全新部署的方式。
原地迁移的方式适用于 Java 、 Python 等技术栈对于底层的操作系统不敏感的一些场景。这种迁移相对是比较平滑的,可以在原有的操作系统上,保留原有的配置不变,进行原地的迁移。迁移完之后,没有进行操作系统盘的替换工作,它原有的配置能保证一致,应用能够很快的服务起来。原地迁移相比于轮转迁移,原地迁移对于运维人员以及企业的操作系统使用者会更友好一些,运维的成本也更低。
02. 操作系统迁移实践
接下来是关于 SMC 服务器迁移中心提供的操作系统迁移方案的实践,这个服务器操作中心提供白屏化的操作有界面易用、过程可靠、服务有保障、体验一致的优点,这是服务操作中心提供的迁移能力主要的一些特色。它支持的迁移场景是最主流的 CentOS 7 和 8 版本的替换,迁移到阿里云服务器操作系统 2 和 3 版本,龙蜥操作系统也是同样的支持的。把之前在社区以及阿里云积累的一些服务器操作系统迁移的能力做到我们的这个产品化之后,简化了所有用户对于操作系统迁移替代的使用成本。
在 SMC 服务器的操作系统迁移中心上进行操作系统迁移实践的时候,主要有以下三个步骤。第一是导入迁移源,这个过程会对实例的操作系统版本、实例规格进行一个初步条件的评估,评估之后完成迁移工具的部署,部署在实例上。第二是迁移演练,这一步是可选的,如果用户只想进行迁移演练,进行一个预评估和摸排,可以只创建一个演练任务即可,这并不是一个实际的迁移任务,只是进行演练,相当于一个预评估。包含了阿里云条件的检测、操作系统预迁移的检测以及迁移的预评估,它会给出前期报告或者一些不满足条件的情况会进行一些提示。第三是正式迁移,任务会自动对实例和操作系统进行备份,这是安全性的保障,备份之后,进行操作系统具体的迁移实施,进度在控制台上是可跟踪的。在操作系统迁移完成之后,会对迁移的结果进行验证,如果不满足条件或者是工程迁移失败,会通过之前安全的快照进行回滚,保证整个迁移的流程安全可靠。
为了简化操作,我们在控制台上进行白屏化操作的时候设计了以下步骤,可以让大家更快的进行一些操作。第一步就是在控制台上导入迁移源,比如要迁移哪个实例、哪台机器,导入即可。导入会进行一些阿里云平台上的检查、操作系统版本的检查以及部署迁移工具。第二步是开始迁移任务,可以选择 Alibaba Cloud Linux 或者龙蜥操作系统作为 CentOS 替代的目标操作系统。选择了目标操作系统之后,就可以开始迁移任务了,在控制台上就可以看到它的进度以及最终迁移的结果。
我们的服务器操作系统还有另一个入口,服务器迁移中心 SMC 有一个入口, ECS 控制台上也有一个入口。在这个提示的界面可以更快速地进入到迁移流程里,只要选择操作系统迁移替换,然后选择目标操作系统确认之后,继续操作系统更换,这样一键步骤就相当于创建了迁移任务,进行了一个迁移替换的过程,整个流程就是为了简化操作,白屏化保证清晰易用。
03. 迁移故障处理
因为操作系统迁移是一个比较复杂的流程,对于不同用户的使用场景是不一样的,如果在操作系统迁移的流程中出现了不满足迁移条件或者配置有差异的问题,迁移任务会中断,给出错误的提示,我们的官网上会有针对服务器操作中心的操作系统迁移出现问题的一些诊断方式和排查文档,大家可以自助的解决问题,如果这个文档里没有包含具体遇到的问题或者有一些复杂操作需要去求助专业人员的时候,我们的服务器操作系统的团队是 24 小时服务的,可以通过服务器操作中心的运维群去提供一些咨询的服务或者问题的解答,还有专门的工单系统,可以替工单进行一个问题的排查。希望通过这样一套服务流程以及技术能力产品化的流程,帮助云上的客户更方便地从 CentOS 迁移到 Alibaba Cloud Linux 和龙蜥操作系统。