一文看懂 Cloudera 对 CDH/HDP/CDP 的产品支持策略

本文涉及的产品
云原生大数据计算服务 MaxCompute,5000CU*H 100GB 3个月
云原生大数据计算服务MaxCompute,500CU*H 100GB 3个月
简介: 一文看懂 Cloudera 对 CDH/HDP/CDP 的产品支持策略

一文看懂 Cloudera 对 CDH/HDP/CDP 的产品支持策略

前言

大家好,我是明哥。

熟悉大数据业界的小伙伴们都知道,Cloudera 在跟HortonWorks 合并后,便推出了新一代大数据平台 CDP,并正在逐步停止原有的大数据平台 CDH 和 HDP。

但具体到何时会彻底停止对 CDH 和 HDP 的维护,CDH/HDP 停止维护后现有用户该如何应对,以及 CDP 跟 CDH/HDP 的异同,或多或少都有些模式。

笔者希望通过本文,能彻底回答清楚小伙伴们的上述问题。以下是正文。

CDH/HDP 各版本的关键时间点

  1. 下图简要介绍了CDH和HDP侧重的技术领域:
  • 可以看到CDH和HDP都重点涵盖了数据工程和数据仓库场景
  • 同时CDH对AI,ML和数据科学场景有侧重
  • 而HDP对IoT数据摄取和流场景有侧重

image.png


  1. 下图简要介绍了目前市面上主流CDH和HDP版本的关键时间点
  • HDP2.x和CDH5.x对应的是hadoop2.x
  • HDP3.x和CDH6.x对应的是hadoop3.x
  • 目前官方已经停止了对HDP2.x和CDH5.X的技术支持
  • 官方对HDP3.x和CDH6.x的技术支持也都会在最近半年停止
  • 具体来讲,HDP3.x的最新版HDP3.1会在2021/12月停止技术支持
  • 具体来讲,CDH6.x的最新版CDH6.3会在2022/3月停止技术支持

image.png


CDP 介绍

  1. CDP 可以认为是将原来的 CDH/HDP 融合在了一起,具体融合方式如下图所示,关键点是:
  • 淘汰了竞争的技术
  • 融合了重叠的技术
  • 保留了互补的技术
  • 升级了共享的技术
  • 并增加了某些新功能


image.png

image.png

2. CDP 对应不同场景,推出了三大版本:

  • 对应公有云场景的 CDP public cloud,目前三大公有云厂商 aws, gcp, azure都已经提供了支持;
  • 对应私有云场景的 CDP private cloud plus,其计算集群使用了 docker 和 k8s 相关技术;
  • 对应数据中心场景的 CDP private cloud base, 其实对应的就是原来场景的 CDH 和 HDP;
  • 三大版本底层对应的是同样的 cloudera runtime,其实质就是大数据各个具体组件,如 hdfs/hive/spark等等。

image.png

image.png

Cloudera 的新许可证政策

Cloudera 的新许可证政策如下图所示,其关键点是:

  • Cloudera 所有产品都将开源 (至少承诺的是如此,包括原来CDH中不开源的cloudera manager等也将开源),其开源模型类似 Red Hat开源模型
  • Cloudera 所有产品的二进制文件和源代码,都需要订阅,(即不再提供社区版,只提供企业版,都需要付费,不再有免费的午餐!)
  • 自2019年11月以来,访问产品的二进制文件需要订阅和 paywall credentials (即没有paywall credentials 的话,将不再能从 cloudera 官网下载 parcel/rpm 包)
  • 2021年1月后,扩展的Paywall将包括平台的早期版本,包括所有版本的CDH/HDP/HDF等 (即目前所有版本的CDH/HDP/HDF/CDP,从官网下载 parcel/rpm 包,都需要有 paywall credentials)

image.png

image.png

使用遗留CDH/HDP系统的小伙伴们该何去何从

概括起来,使用遗留CDH/HDP系统的小伙伴们,有以下选择:

  1. 继续使用原有版本的CDH/HDP:在指定日期之后,Cloudera官方不再对原有版本的CDH/HDP提供技术支持,这仅仅意味着Cloudera官方不会再对原有版本提供新特性增强,也不再对原有版本提供BUG修复,但客户原有的大数据平台仍然是能够正常提供服务的 (这点不同于星环的TDH,TDH在许可证到期之后,整个集群中的服务就不能再重启,不能在正常提供服务了);
  2. 考虑市面上其他供应商的大数据平台,如星环的TDH,或基于开源apache版本自行封装。不过需要注意,星环的TDH是闭源的,其一些参数跟开源的并不兼容,有 vendor lock in的风险;
  3. 按照Cloudera的建议,在合适的时机,升级到 CDP平台。

如何从 CDH/HDP 迁移到CDP?

Cloudera 提供了一系列工具帮助大家尽量平滑地从CDH/HDP升级到CDP。

  1. Cloudera官方建议的升级方式有四种方式:
  • 原地升级
  • 拷贝升级/迁移升级
  • 滚动式拷贝升级/迁移升级
  • 迁移到公有云

image.png


  1. 不考虑迁移到共有云的话,大家可以主要考量两种迁移方式,即原地升级和拷贝升级/迁移升级,其优缺点如下图所示:

image.png


各种迁移方式的详细对比,和操作手册,Cloudera官网有消息描述,笔者在这里就不再赘述了。

相关实践学习
基于MaxCompute的热门话题分析
本实验围绕社交用户发布的文章做了详尽的分析,通过分析能得到用户群体年龄分布,性别分布,地理位置分布,以及热门话题的热度。
SaaS 模式云数据仓库必修课
本课程由阿里云开发者社区和阿里云大数据团队共同出品,是SaaS模式云原生数据仓库领导者MaxCompute核心课程。本课程由阿里云资深产品和技术专家们从概念到方法,从场景到实践,体系化的将阿里巴巴飞天大数据平台10多年的经过验证的方法与实践深入浅出的讲给开发者们。帮助大数据开发者快速了解并掌握SaaS模式的云原生的数据仓库,助力开发者学习了解先进的技术栈,并能在实际业务中敏捷的进行大数据分析,赋能企业业务。 通过本课程可以了解SaaS模式云原生数据仓库领导者MaxCompute核心功能及典型适用场景,可应用MaxCompute实现数仓搭建,快速进行大数据分析。适合大数据工程师、大数据分析师 大量数据需要处理、存储和管理,需要搭建数据仓库?学它! 没有足够人员和经验来运维大数据平台,不想自建IDC买机器,需要免运维的大数据平台?会SQL就等于会大数据?学它! 想知道大数据用得对不对,想用更少的钱得到持续演进的数仓能力?获得极致弹性的计算资源和更好的性能,以及持续保护数据安全的生产环境?学它! 想要获得灵活的分析能力,快速洞察数据规律特征?想要兼得数据湖的灵活性与数据仓库的成长性?学它! 出品人:阿里云大数据产品及研发团队专家 产品 MaxCompute 官网 https://www.aliyun.com/product/odps 
相关文章
|
安全 Java 大数据
CDH/HDP/CDP等大数据平台中如何快速应对LOG4J的JNDI系列漏洞
CDH/HDP/CDP等大数据平台中如何快速应对LOG4J的JNDI系列漏洞
|
存储 分布式计算 Hadoop
如何升级CDH7.1.1到CDH7.1.3
如何升级CDH7.1.1到CDH7.1.3
206 1
|
SQL 存储 分布式计算
《CDP企业数据云平台从入门到实践》——如何迁移CDH/HDP到CDP(4)
《CDP企业数据云平台从入门到实践》——如何迁移CDH/HDP到CDP(4)
159 0
|
SQL 安全 Java
《CDP企业数据云平台从入门到实践》——如何迁移CDH/HDP到CDP(3)
《CDP企业数据云平台从入门到实践》——如何迁移CDH/HDP到CDP(3)
190 0
|
API 数据处理
《CDP企业数据云平台从入门到实践》——如何迁移CDH/HDP到CDP(2)
《CDP企业数据云平台从入门到实践》——如何迁移CDH/HDP到CDP(2)
257 0
|
安全 API 数据处理
《CDP企业数据云平台从入门到实践》——如何迁移CDH/HDP到CDP(1)
《CDP企业数据云平台从入门到实践》——如何迁移CDH/HDP到CDP(1)
248 0
|
SQL 消息中间件 Kafka
atlas 集成cdh
atlas 集成cdh
atlas 集成cdh
|
分布式计算 Hadoop 大数据
hadoop集群离线化搭建(利用HDP快速搭建大数据集群)(二)
000hadoop集群离线化搭建(利用HDP快速搭建大数据集群)
160 0
hadoop集群离线化搭建(利用HDP快速搭建大数据集群)(二)
|
消息中间件 SQL 分布式计算
Cloudera Enterprise 6.0发布【集成Hadoop3.0】
Cloudera Enterprise 6.0发布【集成Hadoop3.0】
135 0
|
存储 物联网 测试技术
Cloudera CDP灾难恢复简介
客户旅程正在从单一数据集群、单一云和简单的基础设施演变为健壮、容错的架构,使得可以在故障事件中幸存下来并保持客户正常运行。目标是在运营危机期间尽量减少对客户数据驱动决策的影响。为此,我们需要为 CDP 实施建立标准,以解决故障、缓解故障。
Cloudera CDP灾难恢复简介
下一篇
无影云桌面