【Dataphin 智能运维】千呼万唤的调度限流配置功能终于上线了!

简介: Datatphin V3.4版本全新上线调度限流功能,支持根据业务优先级和资源情况,控制不同时间段内不同任务的下发数量。基于限流能力,不仅可以减少对底层计算引擎和上下游数据源的并发压力,保证高优任务优先分配调度及计算资源,任务能按序产出;同时也能实现故障异常场景下的快速止血,增强整体稳定性。

Datatphin V3.4版本全新上线调度限流功能,支持根据业务优先级和资源情况,控制不同时间段内不同任务的下发数量。基于限流能力,不仅可以减少对底层计算引擎和上下游数据源的并发压力,保证高优任务优先分配调度及计算资源,任务能按序产出;同时也能实现故障异常场景下的快速止血,增强整体稳定性

背景简介

基于Dataphin的任务调度系统,周期实例和补数据实例运行需要同时满足两个条件:1)上游依赖全部运行成功;2)实例已经到达定时调度时间。满足这两个条件后,实例就会被下发到资源调度系统,如果调度资源充足,则会开始运行(如Python、Shell任务)或者被继续下发到计算引擎(SQL任务)执行。

某些场景下,由于低优先级任务比高优先级任务更早满足运行条件,会被优先下发并占用大量资源,从而导致高优先级任务因为资源不足而出现长时间等待状态,影响下游业务数据产出。此外,如果大量任务被同时下发,计算引擎和数据源也可能因为并发或高产生异常,导致系统崩溃。

以上场景,都需要运维人员大量的手动干预,成本极高。严重情况下,可能因为无法干预或介入较晚而产生严重的问题,影响系统稳定性和数据质量。因此,我们需要强有力的任务并发控制能力。

功能介绍

Dataphin支持给不同运行环境配置不同的限流规则,可避免开发环境的测试任务占用大量资源从而影响生产环境任务的运行。

每个实例可以命中多条限流规则。在满足了上游依赖和定时时间的校验后,任务调度系统将会校验每个实例命中的所有限流规则,并根据每条规则设置的并发度进行判断。只有命中的所有限流规则均没有达到并发上限时,该实例才会被下发到资源调度系统。

限流规则配置

1、限流对象圈选

您可以快捷配置全局限流,以实现故障场景下的快速止血,也可以按照实例所属项目、调度类型(周期、手动、补数据、一次性查询)、任务类型、业务类型(集成同步、离线数据处理、建模研发、萃取研发)来圈选需要限流的实例,实现灵活限流配置。

image.png

2、并发运行控制

圈选完需要限流的对象后,您可以设置并发运行数。当命中该规则,且运行状态为“运行中”和“等待调度资源中”的实例总数达到设置的并发上限后,后续实例被限流不再继续下发,直到有实例运行完成,才会继续下发新的实例。

3、规则生效时间配置

当前支持三种生效时间配置方式:

  • 全时间段
  • 指定时间范围:支持设置开始日期时间和结束日期时间,连续区间,如:2022-04-28 23:25:09 ~ 2022-04-29 23:29:24,支持配置最多三个区间

image.png

  • 指定时间区间:支持设置开始和结束日期,并指定每天的开始时间和结束时间,均匀间隔区间,如:2022-04-12 ~ 2022-04-30 02:30 ~ 05:30,支持配置最多三个区间

image.png

规则生效控制

除了通过指定生效时间来控制限流规则是否可用,您也可以在规则列表快捷批量将规则快捷开启/关闭已经配置的限流规则,即时生效。

规则标签管理

为了更好地对限流规则进行分类管理,Dataphin支持设置规则标签,您可以给每条限流规则打上一个或多个标签,并支持根据标签进行筛选,便于快速找到需要查看的规则并执行操作。

image.png

售卖说明

限流功能作为Dataphin增值模块“智能运维”的功能之一,可以在购买基础研发版或智能研发版的基础上叠加购买。

新功能预告

V3.5版本中,Dataphin将上线“运行诊断”功能,支持按照上游依赖、定时时间、限流规则、调度资源、实例运行五个流程,对实例运行进行分析,帮助用户快速识别问题并并提示可能的原因和修复建议,降低运维人员的判断和分析成本,敬请期待!

相关文章
|
SQL 人工智能 分布式计算
【产品升级】Dataphin V5.3 全新上线:四大能力升级,数据管理更统一、更智能!
V5.3版本,Dataphin推出众多重磅功能:例如,全新的智能应用:X-数据标准、X-数据安全以及智能应用反馈看板;更前沿的数据研发能力:利用SelectDB/Doris/StarRocks查询加速Hive和MaxCompute的离线引擎、全面支持Paimon格式的数据湖构建;资产运营和数据服务持续提效。
595 0
|
8月前
|
SQL 运维 自然语言处理
Dataphin智能化重磅升级!编码难题一扫光,开发运维更高效!
Dataphin重磅推出三大核心智能化能力:智能代码助手提升SQL开发效率;智能运维助手实现移动化任务管理;智能分析通过自然语言生成SQL,助力数据价值释放。未来将持续开放智能ETL、安全助手等能力,助力企业构建高效、稳定的数据资产体系。
638 0
|
10月前
|
弹性计算 调度
Dataphin功能Tips系列(52)-调度资源组弹性伸缩
Dataphin支持通过自定义资源组实现弹性资源调配:设置资源上下限,允许资源组间相互“借用”空闲资源。当开发环境任务暂停时,其未使用的资源可被生产环境借用,确保资源高效利用,同时保障各环境资源需求。配置时只需明确开发与生产环境的资源上下限,并关联对应项目任务即可实现动态调整。
251 1
|
9月前
|
运维 安全 关系型数据库
【产品升级】Dataphin V5.1版本发布:跨云数据集成、指标管理、平台运维带来重大更新!
V5.1版本新增多项功能:对接AWS生态(支持Amazon EMR、Redshift等),强化研发技术支撑(如API认证升级、全量任务隔离),完善运营消费链路(新增业务指标管理、指标关系图),提升平台综合能力(自定义菜单、缩短升级停机时间)。这些功能助力企业实现高效数据治理与分析,未来还将拓展智能化与国际化支持。
496 0
|
运维 分布式计算 监控
Dataphin深度评测:企业级数据中台的智能实践利器
Dataphin是一款以全链路治理、智能提效和高兼容性为核心的企业级数据中台工具,特别适用于中大型企业的复杂数据场景。其流批一体能力、资源监控工具及行业化模板库可显著提升数据治理水平并降低运维成本。通过周期补数据功能,历史数据修复效率提升约60%;智能建模功能使建模时间缩短50%。尽管在数据源支持(如SAP HANA、DB2)和用户体验上仍有改进空间,但其强大的功能使其成为构建企业级数据中台的优选工具,尤其适合零售、金融等行业需要高效数据治理与实时分析的企业。
|
7月前
|
SQL 数据管理 API
【产品升级】Dataphin V5.2 全新上线:四大能力升级,数据管理更统一、更智能!
Dataphin是阿里巴巴推出的数据建设与治理平台,提供全链路数据服务,助力企业构建标准化数据资产体系。V5.2版本新增“数据资产一站式运营平台”,引入X-数据管家、X-ETL等智能应用,提升数据运营效率。开发平台全面升级,支持多云复杂环境,强化API行级权限管控,保障数据安全。新版还适配国际化多时区场景,助力企业高效协同,释放数据价值。
510 9
|
6月前
|
数据采集 调度
Dataphin功能Tips系列(74)质量规则调度配置系列(1)-数据更新触发调度
在数据生产中,数据质量直接影响业务准确性。Dataphin 提供“数据更新触发调度”功能,结合强规则校验,可在数据更新时自动检测质量,异常时阻断下游任务,防止脏数据扩散,保障数据准确性与流程稳定。
137 0
|
11月前
|
SQL 数据采集 分布式计算
Dataphin测评:企业级数据中台的「智能中枢」与「治理引擎」
Dataphin是一款智能数据建设与治理平台,基于阿里巴巴OneData方法论,提供从数据采集、建模研发到资产治理、数据服务的全链路智能化能力。它帮助企业解决数据口径混乱、质量参差等问题,构建标准化、资产化、服务化的数据中台体系。本文通过详细的操作步骤,介绍了如何使用Dataphin进行离线数仓搭建,包括规划数仓、数据集成、数据处理、运维补数据及验证数据等环节。尽管平台功能强大,但在部署文档更新、新手友好度及基础功能完善性方面仍有提升空间。未来可引入SQL智能纠错、自然语言生成报告等功能,进一步增强用户体验与数据治理效率。
1079 34
Dataphin测评:企业级数据中台的「智能中枢」与「治理引擎」
|
10月前
|
弹性计算 Kubernetes 调度
Dataphin V5.0:调度资源支持弹性伸缩,有效提升资源利用率
Dataphin在5.0版本新增“调度资源弹性伸缩”功能,通过设置资源组的Min(保障资源)和Max(上限资源),优化资源共享逻辑,提升集群资源利用率。方案涵盖三种资源分配场景,并支持查看实时使用量。
298 16
Dataphin免费试用指南
为您提供Dataphin快速上手操作指南,一起轻松构建数据
708 67

热门文章

最新文章

相关产品

  • 智能数据建设与治理 Dataphin