Cloudera CDP PvC Base7.1.6的新功能是什么?

简介: 当客户考虑更新到产品的最新版本时,他们期望新功能、增强的安全性和更好的性能,但越来越希望拥有更简化的升级过程。伴随着CDP私有云的每个新版本,我们正在努力提供这些内容。伴随着许多新功能,我们正在尽可能简化升级过程。在此博客中,我们将介绍7.1.6版本中的新功能以及从HDP进行的新的就地升级,从而完全消除了替换基础架构和数据迁移的麻烦。

根据IDG的说法,当客户考虑更新到产品的最新版本时,他们期望新功能、增强的安全性和更好的性能,但越来越希望拥有更简化的升级过程。伴随着CDP私有云的每个新版本,我们正在努力提供这些内容。伴随着许多新功能,我们正在尽可能简化升级过程。在此博客中,我们将介绍7.1.6版本中的新功能以及从HDP进行的新的就地升级,从而完全消除了替换基础架构和数据迁移的麻烦。

如下所示,CDP私有云基础堆栈为CDH 5.13 – 5.16HDP 2.6.5的客户提供了升级途径。在此版本中,我们还支持从HDP 3.1.5升级。 

Picture1.png

1.CDP私有云基础7.1.6提供以下类别的好处:

·更好的升级支持 

o   支持从HDP 3.1.5CDP私有云基础版的就地升级,并增强了自动化工具的功能,可以轻松地从Ambari过渡到Cloudera Manager 

o   支持HDP2.6.5CDH5.[13-16]的回滚以及相应的文档

o   使用处理更复杂放置规则的增强工具,改进了公平计划程序容量计划程序的转换。 

·平台增强 

o   YARN新的放置规则引擎为公平调度程序到容量调度程序的迁移提供了更好的转换,并提供了更好的放置规则管理 

o   对父队列和子队列的自动动态队列支持

o   增加了权重模式以支持CDH客户更轻松的过渡。

o   新增了对独立NiFi / Kafka集群的支持

o   我们增加了对RHEL / CentOS 7.9的操作系统支持以及对MySQL8Postgres 12的数据库支持,以进一步协助迁移。

·对象存储

o   Ozone是一种分布式键值对象存储,可提供20于传统HDFS的可伸缩性,并减少了集群蔓延,消除了小文件数量的限制并简化了集群管理。 

o   Ozone支持350TB的密集型节点配置,与HDFS相比,当前的可用存储容量增加了350 并将存储成本降低了50

·SDX –安全与治理 

o   Ranger审核筛选器可提供更好的审核管理。Ranger Audit筛选器有助于使用JSON定义的筛选器来控制捕获的审核事件,以便仅通过包含相关事件来简化审核量。 

o   Ranger Audit UI的改进,它提供了诸如可调整列和通过UI选择可见列的选项之类的增强功能。  

·数据工程 

o   采用Spark 3,将性能提高一倍,现在作为单独的组件发布 

o   Hive Warehouse ConnectorHWC)使数据工程更简单,更快捷。

o   HWC更好的Hive-Spark交互,使数据工程应用程序更简单,更高效地创建。

·数据仓库

o   与传统的MapReduce相比,使用Hive on Tez的有向无环图(DAG)和数据传输原语可提高查询性能。 

o   Impala的改进将性能提高了2倍至7 

o   具有实例化视图和查询缓存的更快的Hive查询

o   我们已在Impala中启用了与角色相关的语句,以允许使用Ranger作为授权提供者,而不是CDH用户的Sentry

·运营数据库

o   Phoenix 5.1增加了事务支持

o   同时支持SQLNo SQL,吞吐性能提高15 – 20

o   支持运行TPC-C基准测试的复杂x-row / x-table分布式事务以及对ANSI SQL的支持,可以轻松地从MySQL数据库迁移到Operational Database

o   我们添加了基于Accumulo 2.0ApacheAccumulo支持的OpDB”,使使用AccumuloHDP客户能够使用语义版本控制,批量导入和简化脚本等功能升级到CDP私有云基础版。

现在,让我们吸引您注意其中的3个功能,并扩展它们为平台带来的功能。

2.平台– HDP 3就地升级增强功能

HDP 3.1.5客户现在可以将其HDP 3集群直接升级CDP私有云基础版,而无需构建新群集并迁移工作负载或数据。

升级路径包括以下步骤: 

Picture2.png

已创建新版本的AM2CM工具(1.2.0),以支持Ambari托管集群到Cloudera Manager托管集群的过渡 

Picture3.png

AM2CM工具将Ambari 2.7.5蓝图作为输入并将其转换为Cloudera Manager部署模板。接下来,客户可以将部署模板迁移到Cloudera Manager,这使客户可以通过Cloudera Manager启动CDP集群。

此外,现在可以使用回滚过程从HDP2CDH5群集进行升级。 

3. 平台– Fair Scheduler升级工具增强功能

公平调度程序到容量调度程序(FS2CS)转换工具为从先前CDH版本升级的客户提供了改进的调度程序过渡。  

借助该工具,客户可以使用相同或更好的SLA来运行其作业或应用程序,而无需进行任何中断或代码更改。将群集升级到CDP之后,客户现在可以使用YARN QueueManager以更加用户友好的方式调整群集资源管理配置。 

我们引入了以下新功能 

·增强型放置规则引擎 

·动态队列支持 

·权重模式

放置规则确定将应用程序和作业分配到的队列。在新的布局规则评估引擎已增强为客户提供以下情况: 

·支持来自单亲的静态队列和动态队列。 

·具有备用操作配置的其他策略选项,可以将其定义为在放置规则的目标队列不存在或无法创建时应执行的操作

·引入放置规则策略可以提供比映射规则创建更好的解决方案,并且可以为最常见的用例提供快捷方式。

·放置规则引擎现在支持create标志,该标志在启用自动动态队列创建时创建不存在的队列。

·自动将旧的放置规则(队列映射)转换为新的基于JSON的格式

从单个页面创建新的放置规则,该规则允许配置所有选项:

Picture4.png

7.1.6之前的版本中,客户可以使用绝对模式(将资源按单位分配)或相对模式(将资源分配为总可用资源的百分比)来将资源分配给队列。在此版本中,我们添加了一种新的分配资源的模式,称为权重模式。权重模式的功能包括:

·将容量分配为数值并以“ w”为后缀。权重是总资源的一小部分。队列优先级用作权重,以确定每个应用程序应获得的总资源的比例。

Picture5.png

·只需点击几下即可在相对和权重模式之间切换

·一键启用队列的自动动态子级创建。这允许父队列同时具有静态和动态子队列。静态队列具有规则和表达式以及预先创建的目标队列和用户映射。动态队列允许基于规则和表达式自动创建队列。可通过YARN队列管理器UI轻松启用此功能。

Picture6.png

Picture7.png

4. 运营数据库– Apache Phoenix 5.1

我们已将Apache Phoenix 5.1作为Operation Database的一部分发布到CDP私有云中,以提供以下功能: 

·基于Apache HBase构建的横向扩展RDBMS

·星型模式支持和演化模式支持

·视图和二级索引支持

·全面支持Apache Omid

通过Phoenix 5.1,我们添加了复杂的x行,x表事务支持(开箱即用地支持TPC-C基准测试)。在此版本之前,Phoenix仅支持单行原子事务。在此版本中,将分片的MySQLPostgreSQL部署迁移到Cloudera变得更加容易,Cloudera的分区管理是完全自动化的,并且扩展并不意味着增加了操作复杂性。  

此版本还对我们的二级索引进行了改进,以确保索引更新与数据插入和高插入之间保持高度一致。

借助7.1.6版本添加的新功能,增强功能和改进的升级途径,现在没有更好的时间将现有的CDHHDP集群过渡到CDP私有云基础版。要计划您的迁移,请参阅CDP升级和迁移路径以获取更多信息,或与您的Cloudera客户团队联系以讨论最佳方法。 

5.其他资源

·CDP私有云基础7.1.6发行说明

·YARN资源分配

·如何使用YARN动态队列 

·7.1.6的新功能

·HDP升级概述 

·HDP 3CDP升级 

·旅程顾问工具

·知识中心

原文作者:Karthik Krishnamoorthy

原文链接:https://blog.cloudera.com/whats-new-in-cdp-private-cloud-base-7-1-6/

目录
相关文章
|
SQL 人工智能 分布式计算
一文看懂 Cloudera 对 CDH/HDP/CDP 的产品支持策略
一文看懂 Cloudera 对 CDH/HDP/CDP 的产品支持策略
一文看懂 Cloudera 对 CDH/HDP/CDP 的产品支持策略
|
6月前
|
存储 监控 网络安全
Doris Manager 24.0 版本正式发布!
Doris Manager 24.0,SelectDB 的 Apache Doris 集群管理工具,迎来重大更新,包括管控模式升级至安全的 Agent 模式、新增任务审计、主机监控、计算节点部署支持等。此版本已获上千企业用户认可。新特性如 Agent 与 Server 间的 HTTP 通信,提升安全性;任务审计记录操作详情;监控模块扩展主机指标;集群巡检支持定时检查。此外,Doris Manager 提供了集群部署、扩缩容、升级、参数配置、日志查看、告警和审计等一系列高效管理功能。体验新版本,请参考安装和使用手册。
Doris Manager 24.0 版本正式发布!
|
存储 分布式计算 负载均衡
OPPO 开源高可用、高性能的 Spark Remote Shuffle Service
大数据计算的兴起,源于 Google 的 MapReduce 论文,MapReduce 的原理很简单,其流程核心则是 Map 和 Reduce 两阶段数据交换,也即 Shuffle。
641 0
OPPO 开源高可用、高性能的 Spark Remote Shuffle Service
|
监控 API
如何通过Cloudera Manager的API获取集群告警信息
如何通过Cloudera Manager的API获取集群告警信息
227 1
|
API 数据处理
《CDP企业数据云平台从入门到实践》——如何迁移CDH/HDP到CDP(2)
《CDP企业数据云平台从入门到实践》——如何迁移CDH/HDP到CDP(2)
256 0
|
SQL 安全 Java
《CDP企业数据云平台从入门到实践》——如何迁移CDH/HDP到CDP(3)
《CDP企业数据云平台从入门到实践》——如何迁移CDH/HDP到CDP(3)
188 0
|
SQL 存储 分布式计算
《CDP企业数据云平台从入门到实践》——如何迁移CDH/HDP到CDP(4)
《CDP企业数据云平台从入门到实践》——如何迁移CDH/HDP到CDP(4)
159 0
|
安全 API 数据处理
《CDP企业数据云平台从入门到实践》——如何迁移CDH/HDP到CDP(1)
《CDP企业数据云平台从入门到实践》——如何迁移CDH/HDP到CDP(1)
248 0
|
分布式计算 Kubernetes Hadoop
迁移传统应用到Kubernetes步骤详解 – 以Hadoop YARN为例
前言 本文已归档到 kubernetes-handbook 【第三章用户指南】的【在Kubernetes中开发部署应用】小节中,一切更新以 GitHub 为准。 本文档不是说明如何在 kubernetes 中开发和部署应用程序,如果您想要直接开发应用程序在 kubernetes 中运行可以参考 适用于kubernetes的应用开发部署流程。
1529 0
|
存储 物联网 测试技术
Cloudera CDP灾难恢复简介
客户旅程正在从单一数据集群、单一云和简单的基础设施演变为健壮、容错的架构,使得可以在故障事件中幸存下来并保持客户正常运行。目标是在运营危机期间尽量减少对客户数据驱动决策的影响。为此,我们需要为 CDP 实施建立标准,以解决故障、缓解故障。
Cloudera CDP灾难恢复简介
下一篇
无影云桌面