开发者社区 > 大数据与机器学习 > 大数据开发治理DataWorks > 正文

DataWorks数据集成实时同步架构是怎样的?

已解决

DataWorks数据集成实时同步架构是怎样的?

展开
收起
甜甜的嘻嘻嘻 2022-09-29 16:56:36 596 0
1 条回答
写回答
取消 提交回答
  • 推荐回答

    输入数据源经过实时库的抽取,包括分库分表、单表或整库多表,DDL,或是通过 实时消息流的对接,实现抽取。然后进行数据处理,包括数据过滤、Groovy 函数和字符 串的替换。最后支持多路输出,即一读多写的实现,读一个数据源同时可以写入到多个 数据源里,最终把数据输出出去。

    以上内容摘自《一站式大数据开发治理DataWorks使用宝典》电子书,点击https://developer.aliyun.com/ebook/download/474可下载完整版

    2022-09-29 17:05:39
    赞同 展开评论 打赏

DataWorks基于MaxCompute/Hologres/EMR/CDP等大数据引擎,为数据仓库/数据湖/湖仓一体等解决方案提供统一的全链路大数据开发治理平台。

相关产品

  • 大数据开发治理平台 DataWorks
  • 热门讨论

    热门文章

    相关电子书

    更多
    DataWorks数据集成实时同步最佳实践(含内测邀请)-2020飞天大数据平台实战应用第一季 立即下载
    DataWorks调度任务迁移最佳实践-2020飞天大数据平台实战应用第一季 立即下载
    DataWorks商业化资源组省钱秘籍-2020飞天大数据平台实战应用第一季 立即下载