开发者社区 > 大数据与机器学习 > 大数据开发治理DataWorks > 正文

dataworks离线同步分表,脚本模式下如何用正则表达式获取全部分表?

dataworks离线同步分表,脚本模式下如何用正则表达式获取全部分表?

展开
收起
真的很搞笑 2023-05-22 16:43:47 81 0
1 条回答
写回答
取消 提交回答
  • 如何一次性同步多个MySQL(RDS)表? 在数据集成的向导模式下,配置好MySQL的数据源后,在选择表的输入框里,可以不停的输入表名称的,凡是选中的表,都会被这个任务一次性的同步到目的端去。image.png 【注意事项】 这里面选择的多个表的schema需要保持一致,否则执行时会报错。 如下图虽然是选择了多个表,但是配置字段映射时,其实只会调取第一个表的schema,并不会报错,但任务执行时就会报错了。 image.png

    同步表名有规律的高级技巧 上面的模式对于一般情况下可能最够使用了,但是还有些用户的表非常多,比如几百个,即便是一个个去选择,也是个非常累的事情,但是这些表的命名都很有规律,比如table_001, table_002, table_003,.... table_xxx,此时切换到脚本模式后,使用特殊命名的方法就可以一次性设置所有表了,如下图:image.png 具体参数的使用请参考MySQL Reader。 同步多个库下多个表 如果要一次性同步多个库下多个表,也是可以在向导模式下配置的,只需要点击“添加数据源+”就可以增加一个数据源了,而一个数据源对应一个库,由此也就实现了同步多库多表 image.png

    设置多库之后的效果: image.png 如果每个库下还有多个表命名有规律,此时依旧可以切换到脚本模式,然后使用特殊表名命名规则来支持。 注意: 1、目前只支持mysql数据源; 2、源端的表结构要相同,不同的数据库密码要相同; 3、多个库要添加多个数据源;,此回答整理自钉群“DataWorks交流群(答疑@机器人)”

    2023-05-22 16:57:38
    赞同 展开评论 打赏

DataWorks基于MaxCompute/Hologres/EMR/CDP等大数据引擎,为数据仓库/数据湖/湖仓一体等解决方案提供统一的全链路大数据开发治理平台。

相关产品

  • 大数据开发治理平台 DataWorks
  • 相关电子书

    更多
    DataWorks数据集成实时同步最佳实践(含内测邀请)-2020飞天大数据平台实战应用第一季 立即下载
    DataWorks调度任务迁移最佳实践-2020飞天大数据平台实战应用第一季 立即下载
    基于DataWorks数据服务构建疫情大屏-2020飞天大数据平台实战应用第一季 立即下载

    相关实验场景

    更多