输入数据源经过实时库的抽取,包括分库分表、单表或整库多表,DDL,或是通过 实时消息流的对接,实现抽取。然后进行数据处理,包括数据过滤、Groovy 函数和字符 串的替换。最后支持多路输出,即一读多写的实现,读一个数据源同时可以写入到多个 数据源里,最终把数据输出出去。
以上内容摘自《一站式大数据开发治理DataWorks使用宝典》电子书,点击https://developer.aliyun.com/ebook/download/474可下载完整版
版权声明:本文内容由阿里云实名注册用户自发贡献,版权归原作者所有,阿里云开发者社区不拥有其著作权,亦不承担相应法律责任。具体规则请查看《阿里云开发者社区用户服务协议》和《阿里云开发者社区知识产权保护指引》。如果您发现本社区中有涉嫌抄袭的内容,填写侵权投诉表单进行举报,一经查实,本社区将立刻删除涉嫌侵权内容。
DataWorks基于MaxCompute/Hologres/EMR/CDP等大数据引擎,为数据仓库/数据湖/湖仓一体等解决方案提供统一的全链路大数据开发治理平台。