DataWorks的数据开发(DataStudio)面向各引擎(MaxCompute、Hologres、EMR、CDH等)提供可视化开发界面,包括智能代码开发、数据清洗加工、规范化任务开发与发布等,保证数据开发的高效与稳定。更多数据开发模块的使用,详情请参见数据开发概述。
通常,写入原始业务数据至DataWorks,并加工为最终结果表的过程如下: 在DataWorks创建多个数据表。例如: 源表:存储从其他数据源同步过来的数据。 结果表:存储经DataWorks清洗加工过的数据。
创建计算节点,对同步任务产出的表数据进行清洗、逐层加工,并将每层结果写入对应结果表。 您也可以在创建表后,使用直接上传方式,将本地数据上传至DataWorks的源表,再通过计算节点进行清洗加工,将加工后的数据存储至结果表。本文使用直接上传本地数据,并通过计算类型节点清洗该表数据为例进行说明。 进入数据开发 登录DataWorks控制台。 在左侧导航栏,单击工作空间列表。 选择工作空间所在地域后,单击相应工作空间后的数据开发。
版权声明:本文内容由阿里云实名注册用户自发贡献,版权归原作者所有,阿里云开发者社区不拥有其著作权,亦不承担相应法律责任。具体规则请查看《阿里云开发者社区用户服务协议》和《阿里云开发者社区知识产权保护指引》。如果您发现本社区中有涉嫌抄袭的内容,填写侵权投诉表单进行举报,一经查实,本社区将立刻删除涉嫌侵权内容。
DataWorks基于MaxCompute/Hologres/EMR/CDP等大数据引擎,为数据仓库/数据湖/湖仓一体等解决方案提供统一的全链路大数据开发治理平台。