Dataphin功能Tips系列(33)-补数据任务

本文涉及的产品
智能数据建设与治理Dataphin,200数据处理单元
简介: 补数据任务

一、场景

Dataphin功能Tips系列(33)-补数据任务-流程图.jpg

小明负责产出老板每天需要看的销售看板,具体的任务dag图如上,原来的BI看板的上游任务都是天调度,且都是0点运行的任务,现在老板要求该BI看板上的数据每半天更新一次,由于F任务依赖于C任务,并要求C任务必须是天调度,但是又需要完成老板的要求,此时该怎么做呢?

二、解决方案及功能

可以采用补数据任务的方式,配置补数据任务,每天中午定时进行补数据,并且只补A->B->C这条链路的数据,此时又能够使BI看板每半天更新一次,又能够不影响其他任务的调度执行

具体操作如下:

①在生产环境的【运维-任务运维-补数据任务】页面中,可以新建一个补数据任务

②选择A任务作为起始节点,下游任务选择【海量模式】,覆盖范围【指定终点】,将终点指定为【C】,这样就可以指定起点到终点的方式,选择一整个链路中的所有节点,在已选节点列表中可以看到,当次补数据任务中会补A、B、C节点的数据

③调度类型选择【定时调度】,定时运行时间选择【日;12:00】,补数据业务日期选择【自定义】定时运行时间前【1】~前【0】天,这样就会重新补上一个业务日期的数据

④根据需要配置并发运行组数、补数据顺序等信息

⑤【补数据实例】页面可以看到这几个实例的补数据状态、开始运行时间、结束运行时间等


通过上述方式,【A->B->C->BI看板】会每半天补一次数据,但不影响到其他的任务的调度执行

相关文章
|
2月前
|
搜索推荐 数据管理
Dataphin功能Tips系列(70)自定义菜单:构建一站式数据管理平台
Dataphin通过自定义菜单功能,支持嵌入企业其他平台URL,实现统一的数据开发与管理平台,提升团队协作效率。
100 8
|
25天前
|
SQL 运维 关系型数据库
【产品升级】Dataphin V5.0版本发布:助力出海业务、增全量一体集成、异步调用API等更多功能等你发现
Dataphin是瓴羊推出的智能数据建设与治理平台,基于阿里巴巴内部实践,提供一站式数据建设与治理能力。V5.0版本研发新增支持Databricks作为离线计算引擎、支持MySQL数据库一键增全量同步、支持管理Hudi、Delta Lake表等;资产运营与消费持续提效,支持批量编辑目录名称及描述、Quick BI仪表板的上架管理等功能,增加资产可用性与盘点效率。
136 8
|
14天前
|
数据采集 调度
Dataphin功能Tips系列(74)质量规则调度配置系列(1)-数据更新触发调度
在数据生产中,数据质量直接影响业务准确性。Dataphin 提供“数据更新触发调度”功能,结合强规则校验,可在数据更新时自动检测质量,异常时阻断下游任务,防止脏数据扩散,保障数据准确性与流程稳定。
|
14天前
|
数据安全/隐私保护
Dataphin功能Tips系列(73)Dataphin行级权限:构建灵活高效的权限管理体系
Dataphin行级权限功能通过“控制字段”实现灵活数据管控,支持多表批量绑定与动态授权,有效降低权限管理复杂度,提升数据安全性与管理效率。
|
14天前
|
数据采集 SQL 数据可视化
Dataphin功能Tips系列(72)一键数据探查,打造高质量数据开发、分析流程
在数据开发与分析前期,掌握数据质量与分布情况至关重要。Dataphin提供高效的数据探查功能,支持手动与自动探查方式,一键生成数据质量报告,帮助用户快速发现空值、异常值、重复值等问题,提升数据准备与分析准确性。
|
14天前
|
SQL 人工智能 搜索推荐
Dataphin功能Tips系列(71)X-数据管家:数据资产运营的「AI外挂」
在企业数据治理中,数据资产规模庞大、字段繁多,手动录入效率低且易出错。Dataphin推出「X-数据管家」,利用大模型智能生成标签、描述及字段类型等信息,支持一键批量上架,大幅提升资产运营效率。
|
5月前
|
测试技术 数据处理 调度
Dataphin功能Tips系列(57)「预览」vs「运行」:离线集成的神奇按钮
在数据开发过程中,使用Dataphin处理离线集成任务时,可能遇到数据过滤和字段计算组件配置正确性的验证问题。通过「预览」功能,可快速验证处理逻辑而不影响目标表;对于需要调度的任务,担心资源占用和耗时超出预期时,可使用「运行」功能进行全流程测试,评估实际耗时与资源消耗。「预览」适合逻辑验证,「运行」用于真实环境模拟,两者结合助力高效开发与调试。
119 5
|
5月前
|
SQL Java 关系型数据库
Dataphin功能Tips系列(53)-离线集成任务如何合理配置JVM资源
本文探讨了将MySQL数据同步至Hive时出现OOM问题的解决方案。
121 5
|
5月前
|
SQL 数据采集
Dataphin功能Tips系列(56)如何实现质量规则的批量修改
本文介绍了在Dataphin中针对Dataphin表和全域数据表的自定义SQL规则的批量修改的方法。
132 4
|
5月前
|
弹性计算 调度
Dataphin功能Tips系列(52)-调度资源组弹性伸缩
Dataphin支持通过自定义资源组实现弹性资源调配:设置资源上下限,允许资源组间相互“借用”空闲资源。当开发环境任务暂停时,其未使用的资源可被生产环境借用,确保资源高效利用,同时保障各环境资源需求。配置时只需明确开发与生产环境的资源上下限,并关联对应项目任务即可实现动态调整。
107 1

热门文章

最新文章