如何建立dataworks的数据源管理?
版权声明:本文内容由阿里云实名注册用户自发贡献,版权归原作者所有,阿里云开发者社区不拥有其著作权,亦不承担相应法律责任。具体规则请查看《阿里云开发者社区用户服务协议》和《阿里云开发者社区知识产权保护指引》。如果您发现本社区中有涉嫌抄袭的内容,填写侵权投诉表单进行举报,一经查实,本社区将立刻删除涉嫌侵权内容。
进入数据源管理页面。登录DataWorks控制台。在左侧导航栏,单击工作空间列表。选择工作空间所在地域后,单击相应工作空间后的进入数据集成。在左侧导航栏,单击数据源 > 数据源列表,进入工作空间管理 > 数据源管理页面。在数据源管理页面,单击右上角的新增数据源。在新增数据源对话框中,选择数据源类型为Hive。在新增Hive数据源对话框中,配置各项参数。Hive数据源包括阿里云实例模式和连接串模式两种类型:以新增Hive > 阿里云实例模式类型的数据源为例。 参数 描述 数据源类型 当前选择的数据源类型为阿里云实例模式。 数据源名称 数据源名称必须以字母、数字、下划线()组合,且不能以数字和下划线()开头。 数据源描述 对数据源进行简单描述,不得超过80个字符。 适用环境 可以选择开发或生产环境。 地区 选择相应的地域。 集群ID 您可以登录EMR控制台,查看集群ID。 EMR实例主账号ID 实例购买者登录控制台,进入安全设置页面查看实例主账号ID。 数据库名 数据库的名称。 Hive登录方式 包括用户名密码登录和匿名登录。 如果您选择用户名密码登录,需要输入HIVE用户名和HIVE密码。 HIVE版本 选择需要使用的Hive版本。 defaultFS Hadoop HDFS文件系统处于action状态的namenode节点地址。格式为hdfs://ip:port。 扩展参数 Hive高级参数配置,例如HA的相关配置,示例如下。 "hadoopConfig":{以新增Hive > 连接串模式类型的数据源为例。
参数 描述 数据源类型 当前选择的数据源类型为连接串模式。 数据源名称 数据源名称必须以字母、数字、下划线()组合,且不能以数字和下划线()开头。 数据源描述 对数据源进行简单描述,不得超过80个字符。 适用环境 可以选择开发或生产环境。 HIVE JDBC URL Hive元数据库的JDBC UR https://help.aliyun.com/document_detail/152156.html,此回答整理自钉群“DataWorks交流群(答疑@机器人)”
DataWorks基于MaxCompute/Hologres/EMR/CDP等大数据引擎,为数据仓库/数据湖/湖仓一体等解决方案提供统一的全链路大数据开发治理平台。