如何在dataworks中使用cdh相关功能？

展开

收起

十一0204 2023-04-11 14:45:04 249 0

4 条回答

写回答

取消提交回答

wljslmz

公众号：网络技术联盟站，InfoQ签约作者，阿里云社区签约作者，华为云云享专家，BOSS直聘创作王者，腾讯课堂创作领航员，博客+论坛：https://www.wljslmz.cn，工程师导航：https://www.wljslmz.com
在DataWorks中使用CDH（Cloudera Distribution for Hadoop）相关功能，需要先进行CDH组件的配置和授权。具体步骤如下：
1. 在DataWorks工作空间中，进入“计算引擎管理”界面，选择“Hadoop”类型，创建CDH集群。在创建过程中，需要填写CDH的相关配置信息，例如HDFS Namenode、ResourceManager、YARN的地址和端口等。创建完成后，可以在“计算引擎管理”中看到已创建的CDH集群。
2. 配置CDH组件。在CDH集群的配置中，选择需要启用和配置的组件，例如Hive、HBase、Spark等，并填写相应的配置信息。
3. 授权CDH集群，允许DataWorks访问CDH服务。在CDH集群管理页面中，选择“Kerberos安全”，进行Kerberos认证的配置。Kerberos认证需要访问Keytab文件和KDC服务等敏感信息，需要根据CDH集群具体的安全策略进行操作。
4. 在DataWorks中创建相关节点，并关联CDH集群。例如，在数据开发中创建Hive节点、Spark节点等，选择相应的CDH集群作为计算引擎，配置相应的参数和资源。
2023-04-27 10:25:15

赞同展开评论打赏
ReaganYoung

值得去的地方都没有捷径

在DataWorks中使用CDH（Cloudera Distribution of Hadoop）相关功能，需要先将CDH集群与DataWorks进行集成。集成完成后，您可以在DataWorks中使用CDH相关功能，例如使用ODPS SQL节点进行Hive SQL查询、使用DataWorks Studio进行Spark计算等。

以下是将CDH集群与DataWorks进行集成的步骤：

创建CDH集群首先需要在阿里云CDH控制台中创建一个CDH集群，并在集群中安装Hadoop、Hive、Spark等组件。在创建CDH集群时，需要选择与DataWorks所在区域相同的区域。

配置CDH集群在CDH集群中安装完成后，需要进行一些配置，以便与DataWorks进行集成。具体配置步骤可以参考阿里云CDH文档中的相关说明。

集成CDH集群和DataWorks 在DataWorks控制台中，进入“数据集成”模块，创建一个CDH数据源。在创建数据源时，需要填写CDH集群的连接信息、用户名和密码等信息。创建完成后，您可以使用CDH数据源连接到CDH集群，并在DataWorks中使用CDH相关功能。

需要注意的是，在使用CDH相关功能时，需要确保CDH集群和DataWorks所在的区域相同，以避免跨区域访问带来的网络延迟和安全问题。同时，还需要确保CDH集群和DataWorks之间的网络互通，以便进行数据传输和计算。

2023-04-16 14:56:09

赞同展开评论打赏
意中人jswy

意中人就是我呀！

在DataWorks中使用CDH相关功能，必须使用DataWorks的独享调度资源组。您需要先保障CDH集群和独享调度资源组的网络可达后再进行后续的相关操作。 https://help.aliyun.com/document_detail/197357.html此答案整理自钉群“DataWorks交流群(答疑@机器人)”

2023-04-12 09:11:13

赞同展开评论打赏
牧羊吖

月移花影，暗香浮动
在DataWorks中使用CDH相关功能，需要这几个步骤：
1. 在DataWorks管理控制台的项目管理中，选择要使用CDH的工作流所在的项目，进入“基础资源”页面，选择“数据集成”模块，并开启该模块。
2. 在“数据集成”模块中，点击“连接管理”按钮，添加Hadoop集群的连接信息，并测试连接是否正常。
3. 在“数据集成”模块中，点击“数据源管理”按钮，添加Hadoop集群所支持的数据源信息。
4. 在“数据集成”模块中，点击“同步任务”按钮，创建一个同步任务，并选择要同步的数据源地址和目标地址。
5. 在“同步任务”中，选择任务所属的连接，并选择操作类型为“Hadoop”，然后填写集群的相关信息，如主机名、端口号以及用户名等。
6. 使用CDH的相关功能，需要在同步任务中编写自定义脚本，根据需要执行相应的操作。
7. 在任务完成后，可以通过数据集成中提供的日志查看执行结果，如果出现错误需要及时修复。
需要注意的是，以上步骤的具体操作可能会因环境、版本等因素而略有不同，具体步骤需要根据实际情况进行操作。
2023-04-11 15:07:54

赞同展开评论打赏