DataWorks的调度参数是在任务调度时使用的参数,这些参数能够根据预设定的规则在每次任务运行时自动替换为真实的取值,实现任务调度时间内参数的动态替换。这种机制可以帮助优化和提升工作流程的灵活性和效率。
在使用调度参数时,有一些注意事项需要了解:
调度参数的使用分为系统内置变量和自定义参数两类。系统内置变量可以直接在代码中使用,不需要手动赋值。相反,自定义参数则需要在代码中手动赋值。
运行与高级运行功能不支持自动替换为常量,因此无法校验配置的调度参数是否符合预期。
在使用调度参数的情况下,DataWorks调度任务各周期代码的入参由该周期对应的定时时间以及您调度参数表达式最终决定。
对于调度参数的配置和使用,可以通过DataWorks提供的冒烟测试功能进行测试和验证。
以上是使用DataWorks调度参数时需要注意的一些关键点,确保正确理解和使用调度参数可以帮助您更有效地管理和优化DataWorks工作流程。
在DataWorks中,调度参数是控制数据集成任务执行时间的设置。以下是一些关于调度参数的注意事项:
调度周期:这是任务执行的频率,单位可以是秒、分钟、小时或天。例如,如果你设置为每5分钟执行一次,那么任务会在每个小时的第5、10、15、20、25分钟执行。
调度开始时间:这是任务开始执行的时间。默认情况下,任务会在0点(午夜)开始执行。
调度结束时间:这是任务结束执行的时间。默认情况下,任务会一直执行,直到被停止。
调度延迟:这是任务在执行前的延迟时间,单位可以是秒、分钟、小时或天。例如,如果你设置为每5分钟执行一次,并在执行前等待10分钟,那么任务会在每个小时的第15、20、25分钟执行。
调度重试次数:当任务执行失败时,可以设置重试的次数。默认情况下,任务只会重试一次。
调度重试间隔:当任务执行失败时,可以设置重试的间隔时间,单位可以是秒、分钟、小时或天。例如,如果你设置为每5分钟执行一次,并在执行失败后等待10分钟重试,那么任务会在每个小时的第15、20、25分钟执行。
在 DataWorks 中使用调度参数时,需要遵守以下注意事项:
节点配置调度参数并发布生产环境自动调度后,调度系统会根据任务运行的业务时间自动替换调度参数的取值。但在数据开发界面测试运行时不经过调度系统,所以直接点击运行或高级运行时需要给代码中的引用的调度参数手动赋值。 例如,使用调度参数bdp.system.bizdate时,调度运行任务时此参数会被替换为当前任务运行的具体的业务时间,但是在数据开发页面通过运行按钮调测代码时,bdp.system.bizdate参数不会替换为业务时间,您需要手动为此参数设置一个具体的时间常量数据,详情可参见开发环境测试调度参数。在数据开发页面测试调度参数的替换情况,请务必使用开发环境冒烟测试。详情可参见开发环境测试调度参数。如果您变更了代码中的变量,或者需要重新为变量赋值常量,请务必使用高级运行。 使用高级运行时,每次运行前均需要为代码中的变量赋值常量,可保障每次运行时代码中的变量取值均为正确的赋值取值。而使用运行时,仅第一次运行时有弹窗出现需要您为变量赋值,后续运行时均不会弹出赋值弹窗,取用第一次的赋值取值,可能会导致取值错误。unknown参数与$[…]参数的用法注意事项:取N小时前、N分钟前的时间数据需用$[…]参数。 unknown参数只能精确到年月日,因此unknown参数不支持unknown等用法。需要精确到秒时,建议使用$[…]参数,例如,$[yyyy-mm-dd-1-1/24]。取N年前、N月前的时间数据需用unknown参数。 $[…]参数不支持$[yyyy-N]、$[mm-N]等这种直接进行年月数据计算的用法。如果需要对年份、月份进行计算,建议使用unknown参数,例如,unknown、unknown。
https://help.aliyun.com/document_detail/137548.html,此回答整理自钉群“DataWorks交流群(答疑@机器人)”
版权声明:本文内容由阿里云实名注册用户自发贡献,版权归原作者所有,阿里云开发者社区不拥有其著作权,亦不承担相应法律责任。具体规则请查看《阿里云开发者社区用户服务协议》和《阿里云开发者社区知识产权保护指引》。如果您发现本社区中有涉嫌抄袭的内容,填写侵权投诉表单进行举报,一经查实,本社区将立刻删除涉嫌侵权内容。
DataWorks基于MaxCompute/Hologres/EMR/CDP等大数据引擎,为数据仓库/数据湖/湖仓一体等解决方案提供统一的全链路大数据开发治理平台。