CDP/HDP 何去何从
一、 CDH/HDP 平台现状
1. Cloudera 公司简介
• Cloudera 公司于 2008 年成立,2014 年进入中国,肯睿(上海)软件有限公司,当时的主要代表产品:CDH 是全球最受欢迎的 Hadoop 发行版,100%开源。
• 2019 年 1 月 3 日,Cloudera 和 Hortonworks 正式合并,合并后 Cloudera 公司整合已有产品和最新的技术,提供端到端的混合数据云平台产品。
• 在 Cloudera,我们相信数据可以使今天的不可能,在明天成为可能。
Cloudera提供的混合数据平台具有安全数据管理和可移植的云原生数据分析。我们使人们能够转换复杂的数据随时随地更快、更轻松地获得可行的洞察力,以增强业务性能并超出预期。Cloudera 助力医院更好地治疗癌症,保护金融机构免受欺诈和网络犯罪的侵害,并帮助人类到达火星,等等不胜枚举。
由开源社区的不懈创新做支撑,Cloudera 为世界各地的公司推进数字化转型,使每个人都可以轻松访问数据并进行分析。
• 2021 年 7 月,Cloudera 中国和阿里云正式战略合作,并发布基于阿里云部署的 Cloudera CDP 混合数据平台产品。
Cloudera 和 Hortonworks 两家公司合并成新的 Cloudera 之后,两家公司的代表产品 CDH 和 HDP 在产品功能上存在重叠性及差异性,再加上科技的发展和一些技术(云计算、计算和存储分离、K8S 容器技术、流式计算和人工智能)变的成熟,Cloudera 将 CDH 和 HDP 进行融合,并增加了新功能,形成了新的产品 CDP。
Cloudera Data Platform(CDP)是一种混合数据平台,旨在实现无与伦比的自由选择——任何云、任何分析、任何数据。CDP 提供在数据中心和多个数据云之间双向安全移动应用程序、数据和用户的自由,无论您的数据位于何处。这一切都归功于现代数据架构:
• 统一的数据编织可以跨多个云和本地智能、安全地集中编排不同的数据源。
• 开放式数据湖库支持对跨混合多云的云原生对象存储中的流数据和存储数据进行多功能分析。
• 可扩展的数据网格通过将所有权分配给跨职能团队,同时维护通用数据基础架构,有助于消除数据孤岛。
2. CDH/HDP 产品公司合并
CDH/HDP 这两个产品比他们的公司在市场上更加广为流传。大部分用户可能只知道 CDH 或者 HDP,而不知道 Cloudera 或者 Hortonworks,实际上 CDH 是 Cloudera公司的代表产品,HDP 是 Hortonworks 公司的代表产品。两家公司都是围绕着大数据平台去做发行版,他们在 2019 年 1 月进行了合并,形成了新的 Cloudera 公司。
合并之后,两家公司的能力也做了一些整合。首先两家公司的平台能力都是围绕着中间的数据工程和数据仓库,他们都具有大数据平台的存储和计算能力。如上图绿色的 IoT 摄取和流是 Hortonworks 另外一款产品提供的能力,主要做实时数据的采集和处理分析。蓝色的是 Cloudera 的另一个产品 CDSW 提供的,来帮助加速机器学习、数据科学的一些应用。这几款产品都可以部署在企业的客户边缘计算、私有云、公有云和混合云上。
两家公司在合并之后,首先把这 4 个产品进行打通,客户可以根据自己的生态选择从边缘计算到人工智能的处理流程。两家公司合并完成之后,紧接着就进行了产品整合,为什么?
在两家公司合并前,Cloudera 当时有两个主推的大数据平台产品:CDH5 和 CDH6。Hortonworks 有两个主推的平台产品:HDP2 和 HDP3。这两家公司的产品分别对应Hadoop2 和 Hadoop3 的发行版,合并成新的 Cloudera 之后,一家公司维护 4 个同质性的平台产品负荷是比较重的,再加上外部技术的发展变化(云计算、计算和存储分离、容器和 K8S 等),Cloudera 最终选择进行平台整合,形成新的产品 CDP。
3. CDH/HDP 的产品生命周期
CDP 的全称是 Cloudera Data Platform。Cloudera 公司的 CDP 推出之后,首先支持了 CDH5 和 HDP2 两个平台的直接升级。随着技术的发展,2020 年也支持了 CDH6和 HDP3 的直接升级。在 CDP 推出之后,HDP 和 CDH 两个平台都可以迁移升级到CDP 平台上,两个产品也进入了 EoS 阶段,逐渐退出市场,其中 CDH5 和 HDP2 在2020 年 12 月底已经不再进行售后支持,CDH6 和 HDP3 也分别在 2021 年底和 2022年 3 月结束它的支持生命周期。
两家公司合并推出 CDP 之后,CDH 和 HDP 产品已经不再增加新的功能,仅是一些维护式的更新,使得已有用户没办法在老的 CDH/HDP 平台上继续获取新的功能和性能提升。
该表是 Cloudera 官网给出的 Cloudera 支持的产品生命周期,主要列出了 CDH 和HDP。其中 Cloudera Enterprise 对应的是 CDH 企业版。可以看到 Cloudera 最新的产品 CDH6 系列和 HDP3 系列,已经全部 EoS 了,不再进行支持。
《CDP企业数据云平台从入门到实践》——CDP/HDP 何去何从 (2) https://developer.aliyun.com/article/1228531?groupCode=ClouderaCDP