4. 配置任务
1) 创建同步任务
在 DataWorks 管控台进入数据集成主站,点击同步任务,新建任务。
选择 Hologres 整库全增量解决方案。
、
2) 选择表并刷新表映射
l 左侧勾选源端需要同步的表 table_a_001、table_a_002、table_b_001、
table_b_002。
l 通过穿梭框选中后移动至右侧。
l 点击批量刷新映射按钮。
提示:
l 目标端 Schema 默认使用源端 Database 名。
l 目标端 Table 默认使用源端 Table 名。
3) 配置表名转换规则
通过增加表名映射规则,来修改目标表的名字。
转换规则配置解释:
l 目标表名为可视化拼接,可以使用内置变量及指定字符串。
l 内置变量可以配置多个字符串转换规则,顺序执行,计算结果值会拼接到目
标表名。
l 上图中的规则可以表达为:
Ø 目标表名=REPLACE(源表名 , ^table_a_\d+$ , tb_a) + _to_holo。
Ø 以源表名 table_a_001 为例,目标表名转换后为:tb_a_to_holo。
l 保存规则后,规则并不会立即生效,需要手动将规则应用到指定的表上,才
能够生效。
按照 table_a 的操作,配置 table_b 的表名转换规则,并应用刷新。
可以看到,目标表名已经配置为:tb_a_to_holo、tb_b_to_holo
关于同步主键的解释
在进行刷新操作时,系统会自动识别源端表的主键信息,如未能识别到主键信息,则需要手动设置主键。
当目标端不存在为自动建表时,会将同名字段设置为主键予以建表。
《全链路数据治理-全域数据集成》——五、分库分表至 Hologres 最佳实践——4. 配置任务(下):https://developer.aliyun.com/article/1222963