备案控制台

开发者社区大数据与机器学习大数据开发治理DataWorks 正文

DataWorks如何实现调度依赖？

DataWorks如何实现调度依赖？

展开

收起

真的很搞笑 2023-09-10 08:18:15 49 版权

版权声明：本文内容由阿里云实名注册用户自发贡献，版权归原作者所有，阿里云开发者社区不拥有其著作权，亦不承担相应法律责任。具体规则请查看《阿里云开发者社区用户服务协议》和《阿里云开发者社区知识产权保护指引》。如果您发现本社区中有涉嫌抄袭的内容，填写侵权投诉表单进行举报，一经查实，本社区将立刻删除涉嫌侵权内容。

1 条回答

写回答

取消提交回答

芯在这

调度依赖就是节点间的上下游依赖关系，在DataWorks中，上游任务节点运行完成且运行成功，下游任务节点才会开始运行。配置调度依赖后，可以保障调度任务在运行时能取到正确的数据（当前节点依赖的上游节点成功运行后，DataWorks通过节点运行的状态识别到上游表的最新数据已产生，下游节点再去取数）。避免下游节点取数据时，上游表数据还未正常产出，导致下游节点取数出现问题。配置节点的调度依赖时，建议根据各个节点的表数据血缘关系来规划配置节点的上下游依赖，确保满足以下原则：一张表的数据只由一个节点产出，且节点的产出表需配置为本节点的输出。说明SQL任务会通过自动解析，将产出表作为本节点输出，无需手动配置。离线同步任务需要手动配置，将产出表添加为本节点输出。上游节点的输出作为下游节点的输入，形成节点间的依赖关系。说明对于没有表数据血缘关系的节点，可以根据节点运行的逻辑上下游关系规划配置节点的依赖关系，配置原则和配置后的结果与有血缘关系的节点一致。DataWorks的调度依赖在各个节点的调度配置中进行配置，每个节点需要为其配置依赖的上游节点和本节点的输出。
DataWorks支持自动解析和手动配置的方式进行调度依赖配置。理想状态下，DataWorks可根据您规范化的节点任务代码开发，识别输入输出命令（如select、insert），根据代码识别表数据的血缘关系，以血缘关系为基座，通过自动解析自动为您配置好节点的调度依赖。特殊场景下，例如本地上传的表，表数据无需周期性调度生成数据时，您可以手动增删节点的调度配置。在提交节点时，DataWorks会检查节点的调度依赖与节点代码中的数据血缘关系是否一致，如果出现不一致的提示，您需要根据实际情况查看是否需要修改调度依赖配置。
https://help.aliyun.com/document_detail/151507.html，此回答整理自钉群“DataWorks交流群(答疑@机器人)”

2023-09-10 14:15:00

赞同展开评论

问答分类：

DataWorks 调度大数据开发治理平台 DataWorks

问答标签：

大数据开发治理平台 DataWorks依赖大数据开发治理平台 DataWorks调度大数据开发治理平台 DataWorks调度依赖

问答地址：

开发者社区 > 大数据与机器学习 > 大数据开发治理DataWorks > 问答

相关问答

DataWorks支持调度python3 任务吗？

76

1

0

DataWorks月调度每月1号 14点跑，日依赖他，也得每天14 点才能跑吗？

80

2

0

DataWorks有一个天调度的节点依赖的是小时调度的节点有没有这种弱依赖的啊？

79

1

0

DataWorks在java程序里，通过API的方式，调度HDW层的某些任务开始执行，有什么参考文档

109

1

0

DataWorks依赖预览基础版有吗，在哪里？

99

2

0

dataworks排除依赖的表（如手工整理上传的表），这个情况会算依赖缺失嘛？

91

1

0

DataWorks python 中如何引用调度系统中的变量时间呢？

107

2

0

DataWorks补数据任务的失败告警和调度任务失败的失败告警发送者，是在哪里配置的？

102

1

0

DataWorks为什么 4点的 middle 没有依赖上游的 5 点？

70

1

0

DataWorks公共调度资源组满了，大家有遇到同样情况吗？

78

1

0

大数据与机器学习

大数据开发治理DataWorks

DataWorks基于MaxCompute/Hologres/EMR/CDP等大数据引擎，为数据仓库/数据湖/湖仓一体等解决方案提供统一的全链路大数据开发治理平台。

我要提问

相关文章

【微电网优化调度】五种多目标优化算法（MOPSO、MOAHA、NSGA2、NSGA3、MOGWO）求解微电网多目标优化调度比较研究【创新未发表】（Matlab代码实现）

【微电网优化调度】五种多目标优化算法（MSSA、MOAHA、MOPSO、NSGA3、NSGA2）求解微电网多目标优化调度研究【创新未发表】（Matlab代码实现）

考虑柔性负荷的综合能源系统低碳经济优化调度【考虑碳交易机制】（Matlab代码实现）

基于长短期记忆网络定向改进预测的动态多目标进化算法（LSTM-DIP-DMOEA）求解CEC2018（DF1-DF14）研究（Matlab代码实现）

考虑阶梯式碳交易与供需灵活双响应的综合能源系统优化调度（Matlab代码实现）

热门讨论

热门文章

数据来源：com.alibaba.fastjson.JSONException: syntax er

阿里云磁盘大小是多少？

数据服务报429请求次数过多咋办呀

DataWorks 运行spark节点，程序logger日志无法展示

Dataphin和 Dataworks 有啥区别呢？

DataWorks中78xxxxx_out的输出是什么?

为什么任务一直提示 Job Queueing…？

DataWorks数据同步失败了，这个是什么意思？

DataWorks常用的SQL函数有哪些

兄弟们啊，同步中DI、RI到底什么意思，是什么的缩写？

展开全部

2万字揭秘阿里巴巴数据治理平台DataWorks建设实践

DataWorks售前咨询

火热邀测！DataWorks数据集成支持大模型AI处理

DataWorks操作报错合集之配置项目连通oss数据源 , 报The request signature we calculated does not match the signature you provided.如何解决

DataWorks Copilot 集成Qwen3-235B-A22B混合推理模型，数据开发与分析效率再升级！

欢迎加入DataWorks产品钉钉交流群

数据中台的智能进化—阿里巴巴十二年数据平台发展历程

IDC：阿里云获2021中国数据治理平台市场份额第一

DataWorks 千万级任务调度与全链路集成开发治理赋能智能驾驶技术突破

DataWorks常见问题之replace 分号无法替换如何解决

展开全部

还有其他疑问?