开发者社区 > 大数据与机器学习 > 大数据计算 MaxCompute > 正文

DataWorks中Pgsql 多库多表批量同步至Maxcompute?

DataWorks中Pgsql 多库多表批量同步至Maxcompute?

展开
收起
真的很搞笑 2023-08-27 14:07:20 52 0
1 条回答
写回答
取消 提交回答
  • 如何一次性同步多个MySQL(RDS)表?
    在数据集成的向导模式下,配置好MySQL的数据源后,在选择表的输入框里,可以不停的输入表名称的,凡是选中的表,都会被这个任务一次性的同步到目的端去。
    image.png

    【注意事项】
    这里面选择的多个表的schema需要保持一致,否则执行时会报错。
    如下图虽然是选择了多个表,但是配置字段映射时,其实只会调取第一个表的schema,并不会报错,但任务执行时就会报错了。
    image.png

    同步表名有规律的高级技巧
    上面的模式对于一般情况下可能最够使用了,但是还有些用户的表非常多,比如几百个,即便是一个个去选择,也是个非常累的事情,但是这些表的命名都很有规律,比如table_001, table_002, table_003,.... table_xxx,此时切换到脚本模式后,使用特殊命名的方法就可以一次性设置所有表了,如下图:
    image.png

    具体参数的使用请参考MySQL Reader。
    同步多个库下多个表
    如果要一次性同步多个库下多个表,也是可以在向导模式下配置的,只需要点击“添加数据源+”就可以增加一个数据源了,而一个数据源对应一个库,由此也就实现了同步多库多表
    image.png

    设置多库之后的效果:
    image.png

    如果每个库下还有多个表命名有规律,此时依旧可以切换到脚本模式,然后使用特殊表名命名规则来支持。
    注意:
    1、目前只支持mysql数据源;
    2、源端的表结构要相同,不同的数据库密码要相同;
    3、多个库要添加多个数据源;
    可以用同步解决方案里整库离线同步;,此回答整理自钉群“DataWorks交流群(答疑@机器人)”

    2023-08-27 15:15:13
    赞同 展开评论 打赏

MaxCompute(原ODPS)是一项面向分析的大数据计算服务,它以Serverless架构提供快速、全托管的在线数据仓库服务,消除传统数据平台在资源扩展性和弹性方面的限制,最小化用户运维投入,使您经济并高效的分析处理海量数据。

相关产品

  • 云原生大数据计算服务 MaxCompute
  • 相关电子书

    更多
    DataWorks数据集成实时同步最佳实践(含内测邀请)-2020飞天大数据平台实战应用第一季 立即下载
    DataWorks商业化资源组省钱秘籍-2020飞天大数据平台实战应用第一季 立即下载
    基于DataWorks数据服务构建疫情大屏-2020飞天大数据平台实战应用第一季 立即下载