DataWorks跨周期依赖与自依赖的配置及典型场景-开发者社区-阿里云

DataWorks百问百答02：如何设置跨周期依赖及自依赖？

2020-03-13 5108

版权

本文内容由阿里云实名注册用户自发贡献，版权归原作者所有，阿里云开发者社区不拥有其著作权，亦不承担相应法律责任。具体规则请查看《阿里云开发者社区用户服务协议》和《阿里云开发者社区知识产权保护指引》。如果您发现本社区中有涉嫌抄袭的内容，填写侵权投诉表单进行举报，一经查实，本社区将立刻删除涉嫌侵权内容。

本文涉及的产品

大数据开发治理平台DataWorks，资源组抵扣包 750CU*H

简介： 为您介绍DataWorks支持三种跨周期依赖模式（依赖上一周期）。

DataWorks支持三种跨周期依赖模式（依赖上一周期）：

一层子节点：依赖当前节点的下游。例如，节点A存在b、c、d三个下游节点，依赖一层子节点是指节点A依赖 b、c、d三个节点的上一周期。
本节点：依赖当前节点的上一周期（即自依赖）。
自定义：手动输入需要依赖的节点id，多个节点间英文逗号分隔，依赖该id节点的上一周期。

注意：不要重复配置依赖，调度配置中配置了“依赖上一周期”后，在“父节点输出”那里，不要重复配置依赖，否则会出现依赖上游“昨天+今天”两天的实例等情况。

跨周期依赖典型场景

【典型场景一】
“一层子节点”应用场景：对本节点的结果表进行清洗，查看是否正常产出最终结果
【典型场景二】
Q：天任务依赖小时任务，不想等24个小时任务实例跑完才跑天任务，天任务希望尽量按定时时间12:00跑
A：上游小时任务配置“依赖上一周期”选“本节点”；下游天任务定时调度时间选12:00，天任务不需要设置跨周期依赖。这样天任务就会在12点开始跑，且依赖最新跑完的那个小时任务实例的数据（下有图解）
【典型场景三】
Q：天任务依赖小时任务昨天的数据
A：下游天任务配置“依赖上一周期”选“自定义”，填上游小时任务的id
【典型场景四】
Q：小时任务依赖天任务，上游天任务跑完，下游小时任务多个周期定时时间已到，导致小时任务多周期并发调起怎么办
A：下游小时任务配置“依赖上一周期”选“本节点”（下有图解）
【典型场景五】
Q：本节点依赖自己的上一周期产出的数据，不知上一周期何时产出
A：本节点配置“依赖上一周期”选“本节点”