DataWorks:依赖上一周期(跨周期依赖)解析

本文涉及的产品
大数据开发治理平台 DataWorks,不限时长
简介: DataWorks的三种跨周期依赖形式解析,跨周期依赖会在运维中心DAG图用虚线展示。

本文档均以修改xc_create节点的配置为案例。

DataWorks的三种跨周期依赖形式:

①一层子节点:
节点依赖关系:依赖当前节点的下游,例如 节点A存在下游节点B、C、D三个节点,依赖一层子节点是节点A依赖B、C、D三个节点的上一周期。
业务场景:本次 任务运行依赖上一周期下游节点对本节点的结果表(本节点输出表)进行清洗的最终结果(是否正常产出)。
②本节点:
节点依赖关系: 跨周期自依赖(依赖当前节点的上一周期。)
业务场景:本次任务运行依赖上一周期该任务的业务数据的产出情况。
③自定义:
节点依赖关系:手动 需要依赖的节点(多个节点用英文下的逗号分隔)​
业务场景:业务逻辑上需要依赖其他的业务数据正常产出,但是本任务中没有操作该业务数据。

依赖上一周期和依赖本周期的区别:

注意:在运维中心中查看节点依赖关系时,所有跨周期依赖的节点都会以虚线 的形式展示。也是任务实际的依赖,下线任务时候这部分的依赖关系也需要去掉,也是任务运行需要判断的条件之一。

70b421ce48c5c670c78842bda610a670f774d476

注意:依赖上一周期和依赖同周期两处填写了一个节点任务,会依赖该节点任务今天和昨天所有的实例。

如果下游是分钟任务并且分钟任务没有做自依赖,那么该任务会依赖分钟任务昨天所有的实例和今天所有的实例。

所以,该出二选一!!!请根据实际情况作出选择。


业务流程节点依赖关系

b0fd6191417a29154d672a76991d0a20fcf26607

运维中心展示如下:

e652783356ae9cbe27f04310063f6fc079fffc6f

xc_create节点代码及配置

节点sql解析:xc_create节点创建xc_1,xc_2两张表(或产出两张表的数据并将xc_1,xc_2作为本节点的输出。

fb3d8cf7bf64f0f6867b64422bf6c2b66e7487a4

xc_select节点代码及配置

节点sql解析:xc_select节点中查询xc_create节点中的表数据,通过自动解析功能解析将xc_create节点作为本节点依赖的上游。

847abf0693512b89fb21a442bdda8571b053cfd5

依赖上一周期:一层子节点

节点依赖: 依赖当前节点的下游,例如 节点A存在下游节点B、C、D三个节点,依赖一层子节点是节点A依赖B、C、D三个节点的上一周期。

业务场景:该任务运行依赖上一周期下游任务对本任务的结果表(本节点输出表)进行清洗的最终结果(下游任务运行成功,本节点本周期任务开始运行,否则反之)。


xc_create 选择依赖一层子节点

eb770f59064caf7cdd7bff44c1a440094c22ed22

运维中心任务依赖关系如图:

ecec26cb7c656224eb5e01c2445a6ec55096b5c0

依赖上一周期:本节点

节点依赖:本次任务运行依赖本节点上一周期任务运行情况,上一周期任务未完成将阻塞本周期任务运行。
业务场景:本次任务数据依赖上次数据清洗情况。

xc_create表配置如图(为便于观察,我将本节点设置为小时调度任务)

14b906955cf6b1458190566ac8b98331d049d907

运维中心的周期实例查看依赖情况,如图:

bcc7d6ec36301d3272b2d732f892c9287c3bec83

依赖上一周期:自定义

节点依赖:代码中没有用到1000374815节点的产出表但是业务上需要取依赖该1000374815节点的上一周期数据是否顺利产出从节点关系来说:xc_create节点需要依赖1000374815节点上一周期。

业务场景:业务逻辑上需要依赖1000374815任务的业务数据正常产出,但是本任务(xc_create)中没有操作该业务数据。


新的节点如下:节点id:1000374815

8f862fc4179eea65ac9a235bcabb359df0a84acf

xc_create节点依赖的上游选择自定义,选择1000374815节点。

e6cfcf8c3acd4232d432ff9a4712d10979862b35

运维中心周期任务依赖如图:

b47b5034599e1afc4b3d8ecd61bb4e5fc32ffba3

【实时场景一】:无法确定上游何时产出数据时,本节点可对上游做跨周期依赖。


【实时场景二】:我的需求是A任务每天每小时整点执行一次,B任务每天跑一次,但是希望A任务每天第一次跑成功后B任务就跑起, 这样可以怎么配置?

  A:A任务配置时,需要勾选“依赖上一周期” 选“本节点”,然后B任务的定时时间为0点,这样每天自动调度实例里B任务实例就只依赖A 任务0点实例即A任务第一个实例。


【实时场景三】:天任务依赖小时任务,不需要依赖今天的数据,只需要依赖昨天的小时数据(直接依赖今天的小时任务实例导致下 游天任务小时到第二天才完成)

  A:天任务调度配置界面选择“依赖上一周期”-“自定义”,将上游小时任务的节点id填进去后,重新提交发布。


有疑问可下方留言


相关实践学习
简单用户画像分析
本场景主要介绍基于海量日志数据进行简单用户画像分析为背景,如何通过使用DataWorks完成数据采集 、加工数据、配置数据质量监控和数据可视化展现等任务。
一站式大数据开发治理平台DataWorks初级课程
DataWorks 从 2009 年开始,十ー年里一直支持阿里巴巴集团内部数据中台的建设,2019 年双 11 稳定支撑每日千万级的任务调度。每天阿里巴巴内部有数万名数据和算法工程师正在使用DataWorks,承了阿里巴巴 99%的据业务构建。本课程主要介绍了阿里巴巴大数据技术发展历程与 DataWorks 几大模块的基本能力。 课程目标  通过讲师的详细讲解与实际演示,学员可以一边学习一边进行实际操作,可以深入了解DataWorks各大模块的使用方式和具体功能,让学员对DataWorks数据集成、开发、分析、运维、安全、治理等方面有深刻的了解,加深对阿里云大数据产品体系的理解与认识。 适合人群  企业数据仓库开发人员  大数据平台开发人员  数据分析师  大数据运维人员  对于大数据平台、数据中台产品感兴趣的开发者
目录
相关文章
|
1月前
|
运维 DataWorks
在DataWorks中,如果您需要在周期实例列表中进行筛选
【4月更文挑战第3天】在DataWorks中,如果您需要在周期实例列表中进行筛选
18 2
|
2月前
|
SQL 运维 DataWorks
DataWorks旧版的运维中心-->周期任务。对应新版的哪个位置?
DataWorks旧版的运维中心-->周期任务。对应新版的哪个位置?
23 4
|
13天前
|
分布式计算 DataWorks 安全
DataWorks产品使用合集之DataWorks 实现节点依赖关系如何解决
DataWorks作为一站式的数据开发与治理平台,提供了从数据采集、清洗、开发、调度、服务化、质量监控到安全管理的全套解决方案,帮助企业构建高效、规范、安全的大数据处理体系。以下是对DataWorks产品使用合集的概述,涵盖数据处理的各个环节。
35 5
|
13天前
|
分布式计算 DataWorks 调度
DataWorks操作报错合集之DataWorks配置参数在开发环境进行调度,参数解析不出来,收到了 "Table does not exist" 的错误,该怎么处理
DataWorks是阿里云提供的一站式大数据开发与治理平台,支持数据集成、数据开发、数据服务、数据质量管理、数据安全管理等全流程数据处理。在使用DataWorks过程中,可能会遇到各种操作报错。以下是一些常见的报错情况及其可能的原因和解决方法。
25 0
|
13天前
|
存储 分布式计算 DataWorks
DataWorks产品使用合集之在DataWorks中,配置时间属性调度周期如何解决
DataWorks作为一站式的数据开发与治理平台,提供了从数据采集、清洗、开发、调度、服务化、质量监控到安全管理的全套解决方案,帮助企业构建高效、规范、安全的大数据处理体系。以下是对DataWorks产品使用合集的概述,涵盖数据处理的各个环节。
33 2
|
13天前
|
分布式计算 DataWorks 安全
DataWorks产品使用合集之在DataWorks中,如何将某个节点添加到自己的“依赖的上游节点”列表中,但该节点在产出任务时显示不为无如何解决
DataWorks作为一站式的数据开发与治理平台,提供了从数据采集、清洗、开发、调度、服务化、质量监控到安全管理的全套解决方案,帮助企业构建高效、规范、安全的大数据处理体系。以下是对DataWorks产品使用合集的概述,涵盖数据处理的各个环节。
26 1
|
13天前
|
数据采集 DataWorks 监控
DataWorks产品使用合集之DataWorks中,完成周期任务的开发的步骤如何解决
DataWorks作为一站式的数据开发与治理平台,提供了从数据采集、清洗、开发、调度、服务化、质量监控到安全管理的全套解决方案,帮助企业构建高效、规范、安全的大数据处理体系。以下是对DataWorks产品使用合集的概述,涵盖数据处理的各个环节。
33 4
|
13天前
|
数据采集 DataWorks 安全
DataWorks产品使用合集之在DataWorks中创建了一个周期任务,但是没有生成周期实例如何解决
DataWorks作为一站式的数据开发与治理平台,提供了从数据采集、清洗、开发、调度、服务化、质量监控到安全管理的全套解决方案,帮助企业构建高效、规范、安全的大数据处理体系。以下是对DataWorks产品使用合集的概述,涵盖数据处理的各个环节。
18 0
|
13天前
|
数据采集 SQL 分布式计算
DataWorks产品使用合集之DataWorks数据质量里面模版规则 '表行数,上周期差值', 小时任务的周期使用的时间是 cyctime 还是 bizdate 如何解决
DataWorks作为一站式的数据开发与治理平台,提供了从数据采集、清洗、开发、调度、服务化、质量监控到安全管理的全套解决方案,帮助企业构建高效、规范、安全的大数据处理体系。以下是对DataWorks产品使用合集的概述,涵盖数据处理的各个环节。
19 0
|
13天前
|
缓存 分布式计算 DataWorks
DataWorks产品使用合集之阿里云DataWorks中,天任务依赖小时任务的调度运行如何解决
DataWorks作为一站式的数据开发与治理平台,提供了从数据采集、清洗、开发、调度、服务化、质量监控到安全管理的全套解决方案,帮助企业构建高效、规范、安全的大数据处理体系。以下是对DataWorks产品使用合集的概述,涵盖数据处理的各个环节。
21 1

推荐镜像

更多