在DataWorks中,配置时间属性调度周期是指在数据集成或数据开发任务中,可以设置一个时间属性作为任务的调度周期。这个时间属性可以是数据表中的某个字段,用于控制任务的调度时间。 当配置时间属性调度周期时,任务会按照时间属性的取值来进行调度。例如,如果时间属性是一个日期字段,设置调度周期为每天,那么任务将每天根据时间属性的日期值进行调度。
DataWorks中,当一个任务被成功提交后,底层的调度系统从第二天开始,将会每天按照该任务的时间属性生成实例,并根据上游依赖的实例运行结果和时间点运行。23:30之后提交成功的任务从第三天开始才会生成实例。例如,一个任务需要每周一执行一次,则只有运行时间是周一的情况下,该任务才会真正执行。运行时间不是周一的情况下,该任务会空跑(直接将任务置为成功),不会实际运行。所以在测试或补数据时,周调度任务需要选择业务日期为运行时间-1。一个周期运行的任务,其依赖关系的优先级大于时间属性。在时间属性决定的某个时间点到达时,任务实例不会马上运行,而是先检查上游是否全部运行成功。说明上游依赖的实例没有全部运行成功,并且已到定时运行时间,则实例仍为未运行状态。上游依赖的实例全部运行成功,并且未到定时运行时间,则实例进入等待时间状态。上游依赖的实例全部运行成功,并且已到定时运行时间,则实例进入等待资源状态准备运行。如果您选择依赖上一周期,配置方法请参见场景2:依赖上一周期的结果时,如何配置调度依赖。调度周期包括分钟、小时、日、周、月和年。说明FTP Check节点的调度周期配置结果会影响FTP Check的停止策略:当调度周期配置为分钟或小时时,停止策略不支持配置为Check停止时间,只能配置为Check停止次数。详情请参见配置FTP Check的检测策略。当调度周期开始配置为天,并且已经配置好停止策略为Check停止时间,此时如果将调度周期修改为分钟或小时,则停止策略Check停止时间选项无效,您需要重新配置停止策略为Check停止次数,否则FTP Check节点无法提交。分钟调度:即每天指定的时间段内,调度任务按N指定分钟的时间间隔运行一次。如下图所示,每天00:00~23:59的时间段内,每隔30分钟调度一次。
目前分钟仅支持最小5分钟的粒度,时间表达式根据上面选择的时间生成,不能手动修改。小时调度:即每天指定的时间段内,调度任务按N1小时的时间间隔运行一次。例如,每天00:00~03:00的时间段内,每1小时运行一次。说明时间周期根据左闭右闭原则计算。例如,配置调度任务在0点~3点的时间段内,每隔1个小时运行一次
https://help.aliyun.com/document_detail/137549.html,此回答整理自钉群“DataWorks交流群(答疑@机器人)”
在DataWorks中配置时间属性调度周期是指在数据开发任务中,可以设置一个时间属性作为任务的调度周期。这样任务将会按照设定的时间属性来触发。这可以帮助用户实现定时调度的任务。具体步骤如下:
版权声明:本文内容由阿里云实名注册用户自发贡献,版权归原作者所有,阿里云开发者社区不拥有其著作权,亦不承担相应法律责任。具体规则请查看《阿里云开发者社区用户服务协议》和《阿里云开发者社区知识产权保护指引》。如果您发现本社区中有涉嫌抄袭的内容,填写侵权投诉表单进行举报,一经查实,本社区将立刻删除涉嫌侵权内容。
DataWorks基于MaxCompute/Hologres/EMR/CDP等大数据引擎,为数据仓库/数据湖/湖仓一体等解决方案提供统一的全链路大数据开发治理平台。