开发者社区 > 大数据与机器学习 > 大数据开发治理DataWorks > 正文

DataWorks配置HBase数据源操作步骤是啥?

DataWorks配置HBase数据源操作步骤是啥?

展开
收起
wenti 2023-01-16 15:40:21 300 0
1 条回答
写回答
取消 提交回答
  • 进入数据源管理页面。登录DataWorks控制台。在左侧导航栏,单击工作空间列表。选择工作空间所在地域后,单击相应工作空间后的进入数据集成。在左侧导航栏,单击数据源 > 数据源列表,进入工作空间管理 > 数据源管理页面。在数据源管理页面,单击右上角的新增数据源。在新增数据源对话框中,选择数据源类型为HBase。在新增HBase数据源对话框中,配置各项参数。 图片.png 参数 描述 数据源名称 数据源名称必须以字母、数字、下划线()组合,且不能以数字和下划线()开头。 数据源描述 对数据源进行简单描述,不得超过80个字符。 适用环境 可以选择开发或生产环境。 配置信息 HBase集群提供给客户端连接的配置信息。 您可以转换hbase-site.xml为JSON格式,并补充scan的cache、batch等更多HBase客户端配置,以优化集群与客户端的交互。 特殊认证方式 选择数据源是否需要进行身份认证。默认选择无。目前认证方式仅支持选择Kerberos认证。关于Kerberos认证详细介绍请参见配置Kerberos认证。 keytab文件 如果特殊认证方式选择为Kerberos认证,请选择需要使用的keytab文件。 如果没有可用的keytab文件,请单击新增认证文件进行添加。 conf文件 如果特殊认证方式选择为Kerberos认证,请选择需要使用的conf文件。 如果没有可用的conf文件,请单击新增认证文件进行添加。 principal 填写Kerberos认证的主体,即Kerberos账户,格式为:主名称/实例名称@领域名。例如****/hadoopclient@.* 。选择资源组连通性类型为数据集成。在单击资源组列表下,单击相应资源组后的测试连通性。数据同步时,一个任务只能使用一种资源组。您需要在每种资源组上单独测试连通性,以保证同步任务使用的数据集成资源组能够与数据源连通,否则将无法正常执行数据同步任务。详情请参见选择网络连通方案。说明仅支持独享数据集成资源组测试连通性,详情请参见新增和使用独享数据集成资源组。如果您使用的是HBase增强版(lindorm),请忽略测试连通性时出——该回答整理自钉群“DataWorks交流群(答疑@机器人)“

    2023-01-16 16:36:27
    赞同 展开评论 打赏

DataWorks基于MaxCompute/Hologres/EMR/CDP等大数据引擎,为数据仓库/数据湖/湖仓一体等解决方案提供统一的全链路大数据开发治理平台。

相关产品

  • 大数据开发治理平台 DataWorks
  • 热门讨论

    热门文章

    相关电子书

    更多
    DataWorks数据集成实时同步最佳实践(含内测邀请)-2020飞天大数据平台实战应用第一季 立即下载
    DataWorks调度任务迁移最佳实践-2020飞天大数据平台实战应用第一季 立即下载
    DataWorks商业化资源组省钱秘籍-2020飞天大数据平台实战应用第一季 立即下载