在DataWorks中,配置DataHub数据源主要需要以下几个步骤:
创建数据源:登录DataWorks控制台,点击左侧导航栏的“数据源管理”,然后在右侧的列表中选择“新建数据源”。在弹出的对话框中,选择“DataHub”作为数据源类型,然后填写数据源的基本信息,如名称、描述、访问域名和访问端口。
配置数据源连接信息:在数据源基本信息页面,点击“配置连接信息”按钮,然后填写DataHub的数据库名称、用户名和密码。
测试数据源连接:配置完连接信息后,点击“测试连接”按钮,如果连接成功,会在页面下方显示“连接成功”的提示。
保存并返回:最后,点击“保存并返回”按钮,数据源就创建成功了。
创建数据映射:在数据源列表页面,找到刚刚创建的数据源,点击后面的“编辑”按钮,然后在弹出的页面中选择“创建数据映射”。在数据映射创建页面,选择要映射的数据表,然后填写映射信息,如映射名称、映射说明、源数据库、源表、目标数据库、目标表等。
保存并返回:最后,点击“保存并返回”按钮,数据映射就创建成功了。
DataWorks目前暂不支持直接配置datahub数据源,但是可以通过MaxCompute或Flink连接datahub。
具体步骤如下:
在datahub创建topic,并将其导出到MaxCompute或Flink中。
在DataWorks中创建新的MaxCompute或Flink数据源,并配置相应的数据库、表和表结构等。
使用DataWorks中的SQL查询语句来访问和分析datahub中的数据。
配置DataHub数据源的方法如下:
版权声明:本文内容由阿里云实名注册用户自发贡献,版权归原作者所有,阿里云开发者社区不拥有其著作权,亦不承担相应法律责任。具体规则请查看《阿里云开发者社区用户服务协议》和《阿里云开发者社区知识产权保护指引》。如果您发现本社区中有涉嫌抄袭的内容,填写侵权投诉表单进行举报,一经查实,本社区将立刻删除涉嫌侵权内容。
DataWorks基于MaxCompute/Hologres/EMR/CDP等大数据引擎,为数据仓库/数据湖/湖仓一体等解决方案提供统一的全链路大数据开发治理平台。