《CDP企业数据云平台从入门到实践》——Cloudera CDP 产品介绍 (5)

简介: 《CDP企业数据云平台从入门到实践》——Cloudera CDP 产品介绍 (5)

《CDP企业数据云平台从入门到实践》——Cloudera CDP 产品介绍 (4) https://developer.aliyun.com/article/1228592?groupCode=ClouderaCDP


四、 典型场景


1. 为什么选择 CDP


许可证 renew+件更新的机会


HDP 2.6.x/CDH 5.x 覆盖了约 70%的客户群。

CDHHDP EoS

这些软件的客户将需要升到受支持的版


image.png


2. 阿里云 CDP 产品客户价值


1) 更快、更高效、更安全

2) 重大功能增强/性能改进


数据工程:Spark3 性能提升 2 倍;支持 Nvidia GPU ,性能提升 3-7

数据仓库:Impala 性能提升 2 7 倍;引擎 Hive on Tez,支持 ACID、图,性能提升 5 以上。

运营数据库:支持 SQL No SQL 模式,吞吐量性能提15-20%

流处理:完善群管理,复制,流量控制。


3) 安全合规和售后支持


Ranger 提供一的细粒度访问制,态行过滤列掩码。

Atlas 提供完善数据、血缘高级数据现和业务词汇表

持续已报CVE 安全漏洞

专家支持服务,快速解决使用专注业务。


4) 不升级的影响

平台/性能/安全受无法满足部应用国家/行业合性需

售后支持,应用无法放心的广泛应用于生产,影响业务新。


5) CDP7.1 VS CDH6.3


更高版本

CDP HDFSHiveHBaseSparkKafka Solr 等组件版本较新。

更多组件

CDP 增组包括 ZeppelinLivyPhoenixSMMKnoxORCRanger 和 Atlas等等

更长时间


EoS 时间比较


CDH 6.32022 3 月。续仅有维护

CDP 7.12023 5 月。产品线持续更新。


安全合规

CDP Apache Ranger 提供了新的安全能(态行过滤列掩码)。借助Apache AtlasCDP 进了数据资产管理能,助企业PCI GDPR 准。

更高扩展

Apache Hadoop Ozone 是一个分KV 存储,现数十亿模的文件扩展,远远当前 Namenode 文件上300M)。时,Ozone 能与 HDFS 共享数据节点迁移

更易管理


CM7.1 支持在 cgroup 置。C6 必须重动集群才能更新cgroup 置。另外CDP ZK 新版本修复了与 jackson-databindJetty、log4j相17 个安全漏洞


Hive3 体验

Hive on Tez 提供更ETL 性能,时支持 ACID理,兼容 ANSI SQL 2016 准。另外Data Analytics Studio 化展示 HiveSQL 对应的 DAG分图。

Spark 体验

CDP 预装 Spark 2.4.5时支持并行安Spark3.0。可以体验 Spark SQL 适应执行和态分区裁剪等功能。

新的队列管理

CDP YARN Queue Manager 使用 Capacity Scheduler,支持 GPUNode Labels、GlobalScheduling取更加灵活Placement Policy

多种部署方式:支持公有云/本地部署,混合云部署

6) CDP 公有云应用场景

现代数据库

image.png

image.png

运营数据库


image.png

时分析

image.png

理和分析

image.png

现有

选项 A


步骤 1将现有群升CDP PVC Base,从而基于现有数据创建 SDX 环境。

步骤 2CDP 有云并使用体验构建应用

步骤 3使用工作负载管理关键工作负载从 CDP 数据中心版迁移到CDP 有云体验

image.png

选项 B


步骤 1在新件上安CDP 数据中心,并使用 Replication Manager 从现有集群中复制数据、数据和策略以创建 SDX 环境。

步骤 2CDP 有云并使用体验构建应用

步骤 3使用工作负载管理关键工作负载从 CDH/HDP 迁移CDP 私有云体验。

image.png




目录
相关文章
|
1月前
|
监控 安全 数据可视化
java基于微服务的智慧工地管理云平台SaaS源码 数据大屏端 APP移动端
围绕施工现场人、机、料、法、环、各个环节,“智慧工地”将传统建筑施工与大数据物联网无缝结合集成多个智慧应用子系统,施工数据云端整合分析,提供专业、先进、安全的智慧工地解决方案。
54 1
|
1月前
|
机器学习/深度学习 算法 数据可视化
基于Google Earth Engine云平台构建的多源遥感数据森林地上生物量AGB估算模型含生物量模型应用APP
基于Google Earth Engine云平台构建的多源遥感数据森林地上生物量AGB估算模型含生物量模型应用APP
147 0
|
1月前
|
数据库连接 API 网络架构
在 Excel 里使用 ODBC 读取云平台上 CDS view 的数据
在 Excel 里使用 ODBC 读取云平台上 CDS view 的数据
在 Excel 里使用 ODBC 读取云平台上 CDS view 的数据
|
SQL 安全 大数据
《CDP企业数据云平台从入门到实践》——Cloudera CDP 产品介绍 (1)
《CDP企业数据云平台从入门到实践》——Cloudera CDP 产品介绍 (1)
559 0
|
弹性计算 分布式计算 安全
《CDP企业数据云平台从入门到实践》——Cloudera CDP 产品介绍 (2)
《CDP企业数据云平台从入门到实践》——Cloudera CDP 产品介绍 (2)
248 0
|
大数据 定位技术
《CDP企业数据云平台从入门到实践》——Cloudera CDP 产品介绍 (3)
《CDP企业数据云平台从入门到实践》——Cloudera CDP 产品介绍 (3)
229 0
|
9月前
|
机器学习/深度学习 Kubernetes Cloud Native
SAP 云平台 (Cloud Platform) 架构概述
SAP 云平台 (Cloud Platform) 架构概述
|
9月前
|
移动开发 IDE Java
SAP 云平台从 Neo 到 Multi-Cloud 的演化历史
SAP 云平台从 Neo 到 Multi-Cloud 的演化历史
|
9月前
|
数据中心
什么是 SAP 云平台的 multi-cloud architecture
什么是 SAP 云平台的 multi-cloud architecture
|
9月前
|
机器学习/深度学习 JavaScript 前端开发
SAP 云平台 ABAP 编程环境的前世今生
SAP 云平台 ABAP 编程环境的前世今生