《全链路数据治理-全域数据集成》——六、分库表至 MaxCompute 实践——4.任务配置(中):https://developer.aliyun.com/article/1222934
10) 表结构配置
默认的表生命周期为 30 天,表示 MaxCompute 只保留最近 30 天的分区数据,单击 MaxCompute 表名可以编辑这个生命周期。
11) 设置表粒度同步规则
本解决方案支持配置 DML 同步规则,比如想在离线表里保留源库删除的数据,可以这样配置:
12) DDL 消息处理规则
当源库新增符合规则子表时,同步解决方案会自动包含这个子表。并且通过实时同步,同步创建表以来的所有增量数据。删除子表同理。
13) 运行资源设置
本步骤可以配置一些同步时所用的资源组、高级参数。
离线任务除了独享数据集成资源组的资源,还需要使用 DataWorks 调度相关资源,如果没有选择独享调度资源组,会使用公共调度资源组。
调度资源组用于执行每天的数据合并。
14) 提交执行
创建任务后,新任务会出现在任务列表中,单击“提交执行”启动任务。