【阿里云 CDP 公开课】 第五讲:如何迁移 CDH/HDP 到 CDP

简介: 本文整理自 Cloudera 生态资深解决方案工程师王雪峰,分享的《如何迁移CDH_HDP到CDP》,主要分为 CDP升级概述、迁移升级指南两个部分。

本期导读 :【阿里云 CDP 公开课】第五讲


主题:如何迁移 CDH/HDP 到 CDP

讲师:王雪峰,Cloudera 生态资深解决方案工程师


内容框架:

  • CDP 升级概述
  • 迁移升级指南



直播回放链接:(第5讲)

https://developer.aliyun.com/live/248385


一、CDP 升级概述

在旧 CDH/HDP 升级到新 CDP 的过程中,主要有两种原地升级迁移升级两种方式:


原地升级

迁移升级

概述

卸载旧的CDH,保留原有数据,然后安装新版CDH并升级

安装新的CDH集群,然后将现有数据拷贝至新集群,将新的CDH集群切换为生产集群

目标客户

  • 没有富余的主机资源用做中间集群
  • 能够接受较长的服务停机时间
  • 有富余的主机资源(新节点或者缩编现有节点)用做中间集群
  • 要求极短的服务宕机时间

优点

不需要任何额外硬件资源

  • 没有数据丢失风险
  • 较短的服务停机时间

缺点

  • 服务停机时间相对较长
  • 需要多重验证
  • 额外的硬件资源
  • 需要迁移数据
  • 整体升级周期较长

原地升级

image.png

版本要求

HDP2(2.6.5 以上版本)和 CDH5(5.13-5.16 版本)的用户可以直接采用原地升级,升级到 CDP7.03 以上版本。如果低于 HDP2.6.5 版本或 CDH5.13 版本,则需要先升级到对应版本再进行原地升级。而 CDH6 的用户都可以原地升级到 CDP7.1.7 以上版本;HDP3 的用户都可以原地升级到 7.1.6 以上版本。


用户特征

在原地升级的情况下,最适合的用户特征如下:

  • 没有额外的资源
  • 组织有多个集群,可以在配置较低的环境中验证整个升级测试
  • 集群里边有大型的单租户集群,而不是有很多租户,租户之间对时间要求也不一样


升级过程

image.png

  • 备份应用程序和配置
  • 已删除的组件查看和替换应用程序 (docs)
  • 从 DEV开始,升级 CM
  • 部署parcel、激活并升级到CDP Runtime
  • 完成应用冒烟测试
  • 安排停机时间
  • 升级主服务器、工作服务器、边缘服务器和客户端服务器
  • 运行工作负载并完成App Dev Signoff


升级任务

image.png



迁移升级

image.png

用户特征

在迁移升级的情况下,最适合的用户特征如下:

  • 有额外的基础设施,这一点对于阿里云用户来说得天独厚
  • 干净的开始(新服务器配置,新网络,操作系统,平台)
  • 无法承受长时间停机的租户
  • 大型的多租户集群,难以协调切换


升级过程

image.png

  • 资产清单
  • 创建新的 CDP PvC Base 集群
  • 逐步将数据和工作负载迁移到 CDP 集群
  • 随着工作负载从旧集群移出,服务器可以退役,然后添加到新的 CDP 集群
  • 重复使用或停用旧硬件


升级任务

image.png




CDH/HDP 到 CDP 升级路线图

image.png

其中较为推荐CDP7.1.7,版本更为稳定。CDP/HDP 的所有用户都可以通过原地升级或迁移升级到CDP7.1.7。如果需要使用更低的版本,可以在上图找到适合的最低版本。


技术风险和应对措施

image.png


二、迁移升级指南

迁移指导文档:

https://docs.cloudera.com/cdp-private-cloud-upgrade/latest/migrating.html  

迁移升级工作分解

image.png


迁移升级实施流程

image.png

预备期

EE6DA117-4C44-4d4c-83EE-149FAF5392AD.png

并行期

F640EBE7-CB33-4a41-9C49-13AAA307CA1D.png

运行期

30646694-8138-4961-AEC2-640F015E612F.png

数据迁移方案说明

基础组件

8D7F6A9B-7433-4bc8-8128-88B88A1740D3.png


安全+元数据

image.png

数据仓库 +操作型数据库 + 机器学习 + 数据工程

93F3F8C6-126B-4fc9-925C-883B786BF5B0.png

流处理

14D9A0DE-55A2-4a95-ADE6-56521A1C208F.png

Hbase迁移比较

D3241AEE-7F81-4a66-B257-06A486EEAEF1.png

全量&增量数据迁移

48AE257F-D2AE-4b6b-AC3C-3C8F56C90E0D.png


数据一致性校验方法

image.png




image.png

大家如果对产品感兴趣,欢迎加入到阿里云 Cloudera 企业数据云交流群。对产品有任何疑问都可以在交流群里咨询。


以下是产品的链接,有需要的用户可以直接点击链接访问和使用产品。


阿里云官网:https://ac.aliyun.com/application/cloudera

或直接访问:https://market.aliyun.com/products/201190008/cmgj00047952.html

免费测试申请:https://survey.aliyun.com/apps/zhiliao/owtTaIQU3



相关文章
|
2月前
|
运维 Java Devops
阿里云云效操作报错合集之在进行GitLab代码分支迁移时遇到报错,一般是什么原因
本合集将整理呈现用户在使用过程中遇到的报错及其对应的解决办法,包括但不限于账户权限设置错误、项目配置不正确、代码提交冲突、构建任务执行失败、测试环境异常、需求流转阻塞等问题。阿里云云效是一站式企业级研发协同和DevOps平台,为企业提供从需求规划、开发、测试、发布到运维、运营的全流程端到端服务和工具支撑,致力于提升企业的研发效能和创新能力。
|
1月前
|
弹性计算 Prometheus 监控
从自建开源 Prometheus 迁移到阿里云托管 Prometheus 服务
阿里云可观测监控 Prometheus 版提供高性能、高可用、全托管的监控服务,对接开源生态,支持 Kubernetes、ECS 等场景,解决了自建 Prometheus+Thanos 高成本、运维复杂的问题。本文讨论在各个典型场景下的迁移方案。
11756 65
|
1月前
|
弹性计算 Linux 网络安全
使用阿里云服务器迁移中心SMC将其他云平台业务迁移至阿里云教程参考
现在越来越多的个人和企业用户选择将其他云平台或者服务商的业务迁移到阿里云,但是如何快速且安全完成迁移是很多用户比较关注的问题,我们可以选择使用阿里云提供的服务器迁移中心(Server Migration Center,简称SMC),这个产品是阿里云提供给您的迁移平台,专注于提供能力普惠、体验一致、效率至上的迁移服务,满足您在阿里云的迁移需求。本文为大家展示使用阿里云服务器迁移中心SMC将其他云平台业务迁移至阿里云的教程,以供参考。
使用阿里云服务器迁移中心SMC将其他云平台业务迁移至阿里云教程参考
|
17天前
|
数据采集 弹性计算 Prometheus
重磅升级!从自建Prometheus到阿里云托管:无缝迁移,监控能力全面飞跃
【8月更文挑战第2天】如何从自建开源 Prometheus 迁移到阿里云托管 Prometheus 服务
29 2
|
2月前
|
持续交付 开发工具 git
阿里云云效产品使用问题之在云效代码域中gitlab使用docker安装的,迁移时遇到“获取企业信息失败”,是什么原因
云效作为一款全面覆盖研发全生命周期管理的云端效能平台,致力于帮助企业实现高效协同、敏捷研发和持续交付。本合集收集整理了用户在使用云效过程中遇到的常见问题,问题涉及项目创建与管理、需求规划与迭代、代码托管与版本控制、自动化测试、持续集成与发布等方面。
|
2月前
|
敏捷开发 测试技术 持续交付
阿里云云效产品使用问题之如何在新版本的云效上迁移老版本的流水线
云效作为一款全面覆盖研发全生命周期管理的云端效能平台,致力于帮助企业实现高效协同、敏捷研发和持续交付。本合集收集整理了用户在使用云效过程中遇到的常见问题,问题涉及项目创建与管理、需求规划与迭代、代码托管与版本控制、自动化测试、持续集成与发布等方面。
阿里云云效产品使用问题之如何在新版本的云效上迁移老版本的流水线
|
1月前
|
敏捷开发 Java 测试技术
阿里云云效产品使用合集之流水线、应用和项目集该如何迁移
云效作为一款全面覆盖研发全生命周期管理的云端效能平台,致力于帮助企业实现高效协同、敏捷研发和持续交付。本合集收集整理了用户在使用云效过程中遇到的常见问题,问题涉及项目创建与管理、需求规划与迭代、代码托管与版本控制、自动化测试、持续集成与发布等方面。
|
1月前
|
敏捷开发 JSON 缓存
阿里云云效产品使用合集之如何将已有私库迁移至云效私库
云效作为一款全面覆盖研发全生命周期管理的云端效能平台,致力于帮助企业实现高效协同、敏捷研发和持续交付。本合集收集整理了用户在使用云效过程中遇到的常见问题,问题涉及项目创建与管理、需求规划与迭代、代码托管与版本控制、自动化测试、持续集成与发布等方面。
|
1月前
|
SQL 负载均衡 安全
阿里云DTS踩坑经验分享系列|全量迁移加速方法指南
阿里云数据传输服务DTS是一个便捷、高效的数据迁移和数据同步服务。一般而言,一个完整的DTS数据迁移任务主要包括预检查、结构迁移,全量迁移,增量迁移等阶段,其中全量迁移会将源数据库的存量数据全部迁移到目标数据库。面对各种各样的用户场景, 本文将重点介绍如何使用阿里云DTS实现全量数据迁移加速,以缩短迁移时间,确保数据迁移的效率和稳定性。
192 0
|
2月前
|
敏捷开发 Kubernetes 网络安全
阿里云云效产品使用问题之代码从一个账号迁移到另一个账号(从一个企业迁移到另一个企业),该如何迁移
云效作为一款全面覆盖研发全生命周期管理的云端效能平台,致力于帮助企业实现高效协同、敏捷研发和持续交付。本合集收集整理了用户在使用云效过程中遇到的常见问题,问题涉及项目创建与管理、需求规划与迭代、代码托管与版本控制、自动化测试、持续集成与发布等方面。

热门文章

最新文章