《CDP企业数据云平台从入门到实践》——CDP/HDP 何去何从 (3)

简介: 《CDP企业数据云平台从入门到实践》——CDP/HDP 何去何从 (3)

《CDP企业数据云平台从入门到实践》——CDP/HDP 何去何从 (2) https://developer.aliyun.com/article/1228531?groupCode=ClouderaCDP


二、 为什么选择 CDP


1. 什么是 CDP


Cloudera Data PlatformCDP)是 Cloudera 公司的最新产品,该新产品结合了Cloudera Enterprise Data Hub Hortonworks Data Platform Enterprise 的优并在技术增加了新能和对已有技术提供了能。这种统一的发行是一个可展且可自的平台,可以在中安全地运行多类型的工作负载。

image.png

企业希望这种强大的数据管理基础架构迁移到云中,以提高运营效率、降低、提供计算容量灵活性以及速度和敏捷性。


随着在云环境中用基Hadoop 的大数据部署需要企业级的安全性和治理、多分析能、管理工具和技术支持-所有这些都是 CDP 平台的一部分,下图展示了 CDP 平台的图。

image.png

CDP 支持各种混合解决计算任务与数据存储分,并且可以从集群访问数据。这种混合方法通过管理存储、Schema证、授权和治理,并容器应用提供了基础


CDP 包括各种组件,Apache HDFSApache Hive 3Apache HBase 和 Apache Impala,以许多工作负载的件。可以选择这些服务的组合来创建满足您的业务需工作负载的群。几个置的服务也可见的工作负载。


2. 相对于 CDH/HDPCDP 有什么改进


CDP 平台有 40 多个件,是可以提供更多能的企业分析平台。


image.png

个平台合了 CDH HDP 精华来创建些过时的技术淘汰融合新的技术,把双差异性的技术保时升技术得到最新版

image.png

整个 CDP 平台要有两能。


第一通过 Cloudera Manager 整个平台的运营和管理工作,上图中间这部分是 CDP 能,是 CDP 平台有的能和能。最下面支持各种各样的存储,HDFSOzoneKudu、云存储。它有数据移动功能,务编用户能、有运营数据库、数据库的能搜索、安全和治理的能时还有数据的加密密钥管理的能。Cloudera 有的应用比如 CDSW 或Cloudera Data Flow,也可以被 Cloudera manage 管理和支持,来满足企业更广应用使用


CDP CDH HDP 两个产品的产品,有了两个产品的最能,同时增加了新能。整体来有下面这些改进。


高级数据工程


Spark3 性能提升 2

Hive Warehouse Connector 使数据程更简单、更


现代数据仓库


MapReduce 相比Hive on Tez 的有环图(DAG)和数据

查询性能。

Impala 的最新使性能提2 7

使用物图和查询加快 Hive 查询


可靠的运营数据库


支持 SQL No SQL 的多模式,吞吐量性能提15-20%


1) 企业级数据工程


CDP 提供更、更的企业数据程支持。

image.png

Spark 通过 Hive Warehouse ConnectorHWC)来提供高性能的 SPARK

HIVE 互操作性


性能-Hive ACID Spark Direct Reader

Spark Hive Acid v2 降低了复杂性,可以Hive ACID 明读取和大访问。

应用


Spark 创新


CDP 平台上时支持 Spark2.4.7 Spark3使户可以根据

选择使用Spark

Spark 3 提供了性能进,目Cloudera 已经出了 Spark 3.1 GA 版本

Spark 2.4应查询执行、态分区优化。

Spark 2.4 -从上游 Spark 3 复和关键性能优化(DPP向后移植。


整合第三方生态


Livy JDBC/Thrift Server 支持,并提了安全性和性。


加强治理


于提供整数据血缘Spark Atlas ,支持 Spark 级血缘


2) 数据仓库


CDP 中提供的数据化了架构时提供更工作负载。

image.png


《CDP企业数据云平台从入门到实践》——CDP/HDP 何去何从 (4) https://developer.aliyun.com/article/1228528?groupCode=ClouderaCDP

目录
相关文章
|
5月前
|
监控 安全 数据可视化
java基于微服务的智慧工地管理云平台SaaS源码 数据大屏端 APP移动端
围绕施工现场人、机、料、法、环、各个环节,“智慧工地”将传统建筑施工与大数据物联网无缝结合集成多个智慧应用子系统,施工数据云端整合分析,提供专业、先进、安全的智慧工地解决方案。
156 1
|
5月前
|
机器学习/深度学习 算法 数据可视化
基于Google Earth Engine云平台构建的多源遥感数据森林地上生物量AGB估算模型含生物量模型应用APP
基于Google Earth Engine云平台构建的多源遥感数据森林地上生物量AGB估算模型含生物量模型应用APP
211 0
|
5月前
|
数据库连接 API 网络架构
在 Excel 里使用 ODBC 读取云平台上 CDS view 的数据
在 Excel 里使用 ODBC 读取云平台上 CDS view 的数据
在 Excel 里使用 ODBC 读取云平台上 CDS view 的数据
|
SQL 安全 大数据
《CDP企业数据云平台从入门到实践》——Cloudera CDP 产品介绍 (1)
《CDP企业数据云平台从入门到实践》——Cloudera CDP 产品介绍 (1)
665 0
|
弹性计算 分布式计算 安全
《CDP企业数据云平台从入门到实践》——Cloudera CDP 产品介绍 (2)
《CDP企业数据云平台从入门到实践》——Cloudera CDP 产品介绍 (2)
288 0
|
大数据 定位技术
《CDP企业数据云平台从入门到实践》——Cloudera CDP 产品介绍 (3)
《CDP企业数据云平台从入门到实践》——Cloudera CDP 产品介绍 (3)
260 0
|
机器学习/深度学习 消息中间件 监控
《CDP企业数据云平台从入门到实践》——Cloudera CDP 产品介绍 (4)
《CDP企业数据云平台从入门到实践》——Cloudera CDP 产品介绍 (4)
267 0
|
SQL 分布式计算 安全
《CDP企业数据云平台从入门到实践》——Cloudera CDP 产品介绍 (5)
《CDP企业数据云平台从入门到实践》——Cloudera CDP 产品介绍 (5)
365 0
|
机器学习/深度学习 Kubernetes Cloud Native
SAP 云平台 (Cloud Platform) 架构概述
SAP 云平台 (Cloud Platform) 架构概述
|
移动开发 IDE Java
SAP 云平台从 Neo 到 Multi-Cloud 的演化历史
SAP 云平台从 Neo 到 Multi-Cloud 的演化历史

热门文章

最新文章