DataWorks调度参数?

DataWorks调度参数?

展开
收起
真的很搞笑 2023-07-31 10:48:57 117 分享 版权
3 条回答
写回答
取消 提交回答
  • 北京阿里云ACE会长

    在DataWorks中,调度参数是指在调度任务时指定的一些参数,可以用来控制任务的执行方式、数据处理方式等。调度参数可以通过在任务的调度配置中设置或者通过手动触发任务时指定来实现。

    具体来说,您可以在DataWorks中设置以下调度参数:

    时间调度参数:可以指定任务的调度时间、调度频率、调度间隔等。例如,可以设置任务每天凌晨1点自动执行,或者每10分钟执行一次等。

    数据调度参数:可以指定任务的输入输出参数、数据格式、数据分区等。例如,可以指定任务输入的数据源、数据表、数据字段等,或者指定任务输出的数据表、数据格式、数据分区等。

    执行调度参数:可以指定任务的执行方式、执行优先级、执行并发度等。例如,可以指定任务的执行方式为串行或并行、执行优先级为高、执行并发度为10等。

    环境调度参数:可以指定任务执行时的环境变量、资源配置等。例如,可以指定任务执行时的JVM参数、内存限制、CPU配置等。

    2023-07-31 23:53:07
    赞同 展开评论
  • 在阿里云DataWorks中,调度参数是用于配置和控制任务的执行方式和行为的一种机制。通过设置调度参数,您可以灵活地控制任务的调度时间、传递参数、失败重试等。

    以下是一些常见的DataWorks调度参数及其说明:

    1. 执行日期(bizdate):指定任务的执行日期,通常与数据处理任务相关。可以在任务中引用该参数来处理特定日期的数据。

    2. 执行时刻(hour、minute、second):指定任务的具体执行时间,精确到小时、分钟或秒。

    3. 偏移量(offset):允许您相对于调度时间进行时间偏移。可以设置为正值表示将任务推迟执行,负值表示提前执行。

    4. 参数传递(context):通过参数传递机制,您可以在任务之间传递数据。可以在一个任务中设置参数值,并在后续任务中引用这些参数值。

    5. 任务超时时间(tasktimeout):指定任务的最大执行时间。如果任务在超过此时间后仍未完成,则会被认为失败并触发相应的错误处理。

    6. 失败重试次数(retry):指定任务失败后的重试次数。当任务执行失败时,DataWorks将根据设置的重试次数自动重新执行任务。

    7. 失败告警(notify):可以设置任务失败时是否发送告警通知,以便及时了解任务的执行情况。

    这些是一些常见的DataWorks调度参数,根据具体需求,您可以在任务的调度配置中设置适当的参数,以满足任务运行的需求。

    2023-07-31 11:40:35
    赞同 展开评论
  • 【调度参数分类】 根据调度参数能否在代码中直接使用可以分为:系统内置变量,自定义参数。image.png

    • 系统内置变量可以在代码中直接使用,包括 unknown和unknown - 自定义参数需要在调度参数赋值处,给该变量赋值自定义参数后,在代码中调用变量名。(更多自定义参数取值方式请参考文档 调度参数自定义参数部分。) --- 【调度参数unknown $[..]测试示例】 业务时间选择 2018-01-31 区分调度参数$[yyyymmdd] 与unknown 在调度时候的替换值 image.png
      --- 【测试调度参数赋值】 image.png
      --- 【查看参数替换】 image.png
      --- 【调度参数使用注意事项】 image.png
      --- 【注意】 - ”定时时间(中括号)”才可以取到具体的时间点(小时/分钟) - 界面直接点击"运行"需要手动给代码变量赋值。 - 若配置调度参数需要检验调度替换的值是否会符合预期,请选择数界面的开发环境冒烟测试。 - 修改过调度参数后请重新保存-提交-开发环境冒烟测试。 - 任务只有在生产环境才会被调度,所以调度参数只有生产环境调度运行后才会被替换 - 开发环境冒烟测试会生成实例!属于调度收费范畴。 --- 【高级运行/运行/开发环境冒烟测试逻辑说明】 - 运行:第一次运行后,您需要手动为该变量赋值常量,第一次赋值会被记录。如果对代码进行修改,该变量依旧使用第一次运行时的赋值。 - 高级运行:高级运行时,您需要手动为当前代码中的变量进行赋值常量,如果修改了代码中的变量,请使用高级运行给变量重新赋值常量。 - 开发环境执行冒烟测试:通过手动选择业务日期模拟节点自动调度的场景,获取当前业务日期下调度参数的替换值。 如果要修改参数赋值,请使用高级运行。 image.png
      --- 【三种运行按钮关于变量赋值区别】 image.png
      --- 【PyODPS 2节点可以使用系统定义的调度参数和自定义参数:】 如果PyODPS 2使用系统定义的调度参数,可以直接在页面赋值。 自定义参数需要使用args['参数名']的形式调用,例如print (args['ds']) image.png
      --- 【调度参数配置案例】 >Q1:跨年跨月跨天跨小时跨分钟调度参数配置

      A1:调度参数配置:year=$[yyyy-15/24/60] month=$[yyyymm-15/24/60] day=$[yyyymmdd-15/24/60] hour=$[hh24-15/24/60] mi=$[mi-15/24/60]
      实现效果:
      定时时间为20210727000500的取到的调度参数如下
      SKYNET_PARAVALUE=year=2021 month=202107 day=20210726 hour=23 mi=50:
      定时时间为20210727003000取到的调度参数如下
      SKYNET_PARAVALUE=year=2021 month=202107 day=20210727 hour=00 mi=15:
      Q2:如何结合调度参数取上个月的最后一天 > >A2:相关语料“结合调度参数取上个月最后一天” > --- 【相关文档:】 - 调度参数配置 - DataWorks:通过业务时间维度来看自定义参数“[ ]”与“{ }”的区别

    【常用调度参数列表】假设定时时间是2022-10-01 00:10:59

    取昨天的年月日:arg=$[yyyymmdd-1] 或arg=$[yyyy-mm-dd-1]或arg=$[yyyy/mm/dd-1]等 调用unknown
    取昨天的年月日时分秒:返回值2022-09-31 00:10:59 需配置两个参数arg1=$[yyyymmdd-1] arg2=$[hh24:mi:ss] 调用'unknown unknown'
    取今天的年月日: arg=$[yyyymmdd]等
    取今天的年月日时分秒:返回值2022-10-01 00:10:59 配置两个参数arg1=$[yyyymmdd] arg2=$[hh24:mi:ss] 调用'unknown unknown'
    取15分钟前的年、月、日、小时、分钟:year=$[yyyy-15/24/60] month=$[yyyymm-15/24/60] day=$[yyyymmdd-15/24/60] hour=$[hh24-15/24/60] mi=$[mi-15/24/60]
    取1小时前的日、小时:day=$[yyyymmdd-1/24] hour=$[hh24-1/24]
    取昨天时间区间:beginDateTime=$[yyyymmdd-1]000000 endDateTime=$[yyyymmdd]000000
    取上一小时时间区间:beginDateTime=$[yyyymmddhh24-1/24]0000 endDateTime=$[yyyymmddhh24]0000
    ,此回答整理自钉群“DataWorks交流群(答疑@机器人)”

    2023-07-31 10:56:29
    赞同 展开评论

DataWorks基于MaxCompute/Hologres/EMR/CDP等大数据引擎,为数据仓库/数据湖/湖仓一体等解决方案提供统一的全链路大数据开发治理平台。

还有其他疑问?
咨询AI助理