DataWorks_数据开发_调度参数场景案例

本文涉及的产品
大数据开发治理平台DataWorks,资源组抵扣包 750CU*H
简介: 1)取上个月的最后一天;2)取当前季度;3)取定时时间15分钟前的年、月、日、小时、分钟;

调度参数场景案例

场景

取值节点

测试返回值

取上个月的最后一天。

预期返回格式:yyyymmdd

节点类型:ODPS SQL节点为例

调度参数配置:last_month=$[yyyy-mm]

调度参数引用(对调度参数二次处理):SELECT REPLACE(DATEADD(date'${last_month}-01',-1,'dd'),'-','');

测试定时时间CYCTIME:20210926000000

返回值:20210831

取当前季度

预期返回类型:正整数

节点类型:ODPS SQL节点为例

调度参数配置:month=$[mm]

调度参数引用(对调度参数二次处理):SELECT CEIL(INT('${month}')/3);


测试定时时间CYCTIME:20211025001700

返回值:4

取定时时间15分钟前的年、月、日、小时、分钟

预期返回格式:年yyyy、月yyyymm、日yyyymmdd、小时hh、分钟mm

节点类型:ODPS SQL节点为例

调度参数配置:year=$[yyyy-15/24/60] month=$[yyyymm-15/24/60] day=$[yyyymmdd-15/24/60] hour=$[hh24-15/24/60] mi=$[mi-15/24/60]

调度参数引用:select 'year=${year} month=${month} day=${day} hour=${hour} mi=${mi}';


测试定时时间CYCTIME:20210727000500

返回值:

year=2021 month=202107 day=20210726 hour=23 mi=50

取昨天00:00:00到今天00:00:00区间,间隔时间为1天,精确到秒,格式为yyyymmddhh24miss

预期返回格式:yyyymmddhh24miss

节点类型:ODPS SQL节点为例

注:离线同步Kafka Reader插件Loghub Reader插件适用,左闭右开。

调度参数配置:beginDateTime=$[yyyymmdd-1] endDateTime=$[yyyymmdd]
注:如需间隔时间1小时,请配置beginDateTime=$[yyyymmddhh24-1/24] endDateTime=$[yyyymmddhh24]。

调度参数引用:select '${beginDateTime}000000 ${endDateTime}000000';

注:当间隔时间配置为1小时时,select '${beginDateTime}0000 ${endDateTime}0000';


测试定时时间CYCTIME:20220117002300

返回值:20220116000000 20220117000000
注:当间隔时间配置为1小时时,返回20220116230000 20220117000000




FAQ

Q1:当取值节点为离线同步节点等不方便二次处理参数值的节点类型,如何解决?
A1:可以使用赋值节点处理好调度参数,通过节点上下文传递给取值节点(需要对调度参数二次处理的通用解决方案)。


Q2:结合调度参数取值的方式和直接使用MaxCompute日期函数取值有什么区别?

A2:直接使用日期函数取值返回的是计算任务执行机器的时间,不同时间执行同个实例,返回时间会变;结合调度参数取值的方式返回的是和定时时间相关的时间,也就是在任何时候执行同一个实例,返回时间不会变。


Q3:节点中调度参数无论怎么配置且已经提交发布,返回的值始终没有变化。

A3:大概率被同名业务流程参数覆盖,检查业务流程参数,如果不需要可以删除,如果需要节点参数更名。



调度参数调试通用方法

如何测试调度参数配置返回判断是否符合预期?

如图:以ODPS SQL节点为例,橙色测试步骤,绿色配置步骤。date和time的加减规则参见调度参数官方文档

调度参数:调试.png


以下了解:
开发环境冒烟测试,业务日期选2022-01-16 开始时间选00:00 结束时间选01:00
日志中相关参数展示
2022-01-17 12:13:49 INFO SKYNET_BIZDATE=20220116:

2022-01-17 12:13:49 INFO SKYNET_CYCTIME=20220117000000:

调度参数:bizdate和cyctime.png


附录

相关实践学习
基于Hologres轻量实时的高性能OLAP分析
本教程基于GitHub Archive公开数据集,通过DataWorks将GitHub中的项⽬、行为等20多种事件类型数据实时采集至Hologres进行分析,同时使用DataV内置模板,快速搭建实时可视化数据大屏,从开发者、项⽬、编程语⾔等多个维度了解GitHub实时数据变化情况。
相关文章
|
2月前
|
数据采集 运维 DataWorks
DataWorks 千万级任务调度与全链路集成开发治理赋能智能驾驶技术突破
智能驾驶数据预处理面临数据孤岛、任务爆炸与开发运维一体化三大挑战。DataWorks提供一站式的解决方案,支持千万级任务调度、多源数据集成及全链路数据开发,助力智能驾驶模型数据处理与模型训练高效落地。
|
5月前
|
数据采集 SQL 人工智能
长文详解|DataWorks Data+AI一体化开发实战图谱
DataWorks是一站式智能大数据开发治理平台,内置阿里巴巴15年大数据建设方法论,深度适配阿里云MaxCompute、EMR、Hologres、Flink、PAI 等数十种大数据和AI计算服务,为数仓、数据湖、OpenLake湖仓一体数据架构提供智能化ETL开发、数据分析与主动式数据资产治理服务,助力“Data+AI”全生命周期的数据管理。
|
6月前
|
SQL 弹性计算 DataWorks
Flink CDC 在阿里云 DataWorks 数据集成入湖场景的应用实践
Flink CDC 在阿里云 DataWorks 数据集成入湖场景的应用实践
284 6
|
8月前
|
SQL 分布式计算 DataWorks
如何让DataWorks调度依赖一个非DataWorks的任务结点,如数据上传任务?
如何让DataWorks调度依赖一个非DataWorks的任务结点,如数据上传任务?创建一个表的空分区,然后通过DataWorks去检查这个分区。
181 7
|
8月前
|
数据采集 机器学习/深度学习 DataWorks
DataWorks产品评测:大数据开发治理的深度体验
DataWorks产品评测:大数据开发治理的深度体验
366 1
|
9月前
|
DataWorks 搜索推荐 数据挖掘
DataWorks: 驾驭数据浪潮,解锁用户画像分析新纪元
本文详细评测了DataWorks产品,涵盖最佳实践、用户体验、与其他工具对比及Data Studio新功能。内容涉及用户画像分析、数据管理作用、使用过程中的问题与改进建议,以及Data Studio的新版Notebook环境和智能助手Copilot的体验。整体评价肯定了DataWorks在数据处理和分析上的优势,同时也指出了需要优化的地方。
359 24
|
9月前
|
SQL 数据采集 DataWorks
基于DataWorks的多场景实践及数据开发Data Studio最新体验测评
DataWorks是阿里云推出的一站式智能大数据开发治理平台,自2009年发布以来,历经多次迭代,成为企业数字化转型的重要工具。本文通过多个实践案例,如公共电影票房数据预处理,展示了DataWorks如何帮助企业高效处理大数据,涵盖数据集成、ETL开发、数据分析及治理等全流程。最新版DataWorks引入了智能助手Copilot,进一步提升了用户体验和工作效率。
|
10月前
|
数据采集 人工智能 DataWorks
限时优惠体验!DataWorks数据治理中心全新升级为数据资产治理
DataWorks进行全面升级,从数据治理中心转型为数据资产治理,强调业务视角下的数据分类与管理,引入Data+AI全链路数据血缘追踪,提升数据质量和安全性,促进跨部门协作。同时,提供限时优惠活动,助力企业高效利用数据资产。
1216 2
|
数据采集 DataWorks 数据挖掘
提升数据分析效率:DataWorks在企业级数据治理中的应用
【8月更文第25天】本文将探讨阿里巴巴云的DataWorks平台如何通过建立统一的数据标准、规范以及实现数据质量监控和元数据管理来提高企业的数据分析效率。我们将通过具体的案例研究和技术实践来展示DataWorks如何简化数据处理流程,减少成本,并加速业务决策。
905 54
|
SQL 分布式计算 DataWorks
利用DataWorks构建高效数据管道
【8月更文第25天】本文将详细介绍如何使用阿里云 DataWorks 的数据集成服务来高效地收集、清洗、转换和加载数据。我们将通过实际的代码示例和最佳实践来展示如何快速构建 ETL 流程,并确保数据管道的稳定性和可靠性。
440 56

热门文章

最新文章