Dataphin V5.0:调度资源支持弹性伸缩,有效提升资源利用率

本文涉及的产品
智能数据建设与治理Dataphin,200数据处理单元
简介: Dataphin在5.0版本新增“调度资源弹性伸缩”功能,通过设置资源组的Min(保障资源)和Max(上限资源),优化资源共享逻辑,提升集群资源利用率。方案涵盖三种资源分配场景,并支持查看实时使用量。

背景介绍

在3.10的版本中,Dataphin推出了基于K8s的调度系统R.S-3.0,并在产品中支持了自定义资源组功能,用于实现资源的隔离。该功能支持用户在创建租户和资源组时设置可用的CPU和内存,但是也存在一个问题:

现有的调度资源是按照固定配额进行分配,租户或资源组被创建后将长期持有该资源。因为不同租户或资源组使用资源的周期可能不同,所以会出现某一时刻A资源不足,但是B资源闲置的现象,从而导致整个集群的资源利用率下降。

方案介绍

        为了有效提升整体的资源利用率,Dataphin在5.0版本推出了“调度资源支持弹性伸缩”的功能。在确保资源组能够获取保障资源的前提下,通过资源共享的方式来提升整体集群的资源利用率。如下图所示,Dataphin支持设置租户和资源组的可用范围,以资源组为例进行介绍:

  • Min资源:又称可用下限,代表资源组的保障资源
  • 所有资源组可用下限相加不可超过100%(当前租户的可用下限);
  • 当整个集群资源紧张时(每个资源组都需要超过下限额度的资源来运行任务),所有资源组优先获得所设置的下限额度;
  • Max资源:又称可用上限,本资源组可向其他资源组借用其空闲的资源额度,但借用后可使用的资源总量不可超过所设置的上限;

 image.png



现以资源组1中的任务A所需CPU为例,展开介绍资源组获取资源的逻辑。假设任务A运行需要内存为5C,资源组1设置的可用下限为20C,可用上限为50C。当任务A下发到资源组1中,有如下三种场景:

  • 场景1:资源组已分配资源+任务所需资源<=资源组的可用下限
  • 资源组已分配(12C)+任务A运行需要(5C)=17C,小于资源组的可用下限(20C)
  • 所以资源组1会优先获取5C来支持任务A的运行。
  • 场景2:资源组已分配资源+任务所需资源>资源组的可用下限
  • 资源组已分配(16C)+任务A运行需要(5C)=21C,大于资源组的可用下限(20C)
  • 所以资源组会优先获取4C(可用下限(20C)-已分配资源(16C)),剩下的1C会排队获取。
  • 场景3:资源组已分配资源>=资源组的可用下限
  • 资源组已分配资源(30C)>资源组的下限值(20C)
  • 所以集群释放的资源会优先分给资源分配未达下限的资源组,任务A需要的5C会排队获取。

 image.png


功能概览

  • 支持设置租户和资源组的可用范围:
  • 可用下限:当资源紧张时(所有资源组都需要超过下限额度的资源来运行任务),所有资源组优先获得所设置的下限额度;
  • 可用上限:资源组可以借用其他资源组中的空闲资源,但是借用后可用总量不得超过所设置的上限值。

 image.png

image.png



  • 支持查看租户和资源组在当前时刻的具体使用量

 image.png

image.png



相关文章
|
调度
Dataphin功能Tips系列(6)-月调度周期任务补数据的业务日期选择
一个销售额结算的周期任务的调度周期是月调度---每月1号进行调度,但是有一天调整了计算口径后希望重新计算过去几个月的销售额,此时补数据任务的业务日期应该如何选择?
225 4
Dataphin功能Tips系列(6)-月调度周期任务补数据的业务日期选择
|
存储 Oracle 关系型数据库
Dataphin常见问题之想要周期执行任务如何解决
Dataphin是阿里云提供的一站式数据处理服务,旨在帮助企业构建一体化的智能数据处理平台。Dataphin整合了数据建模、数据处理、数据开发、数据服务等多个功能,支持企业更高效地进行数据治理和分析。
|
1月前
|
SQL Java 关系型数据库
Dataphin功能Tips系列(53)-离线集成任务如何合理配置JVM资源
本文探讨了将MySQL数据同步至Hive时出现OOM问题的解决方案。
|
1月前
|
弹性计算 调度
Dataphin功能Tips系列(52)-调度资源组弹性伸缩
Dataphin支持通过自定义资源组实现弹性资源调配:设置资源上下限,允许资源组间相互“借用”空闲资源。当开发环境任务暂停时,其未使用的资源可被生产环境借用,确保资源高效利用,同时保障各环境资源需求。配置时只需明确开发与生产环境的资源上下限,并关联对应项目任务即可实现动态调整。
|
10月前
|
弹性计算 缓存 Kubernetes
异步任务处理系统问题之任务执行子系统实现资源的弹性伸缩的问题如何解决
异步任务处理系统问题之任务执行子系统实现资源的弹性伸缩的问题如何解决
|
10月前
|
弹性计算 Kubernetes 算法
AHPA:Kubernetes弹性伸缩的预言家,揭秘未来资源使用的神秘面纱!
【8月更文挑战第8天】在云原生应用中,Kubernetes已成为部署标准。面对不断扩大的集群与应用规模,有效资源管理和弹性伸缩成为关键。AHPA(自适应历史感知预测算法)作为先进的预测技术,通过分析历史数据预测资源需求并自动调整Kubernetes资源分配。以一个在线零售平台为例,通过AHPA识别流量周期性变化,在节假日高峰期前自动增加Pod数量,保证服务稳定;而在平峰期减少Pod数量,节省资源。AHPA为Kubernetes提供了智能化的弹性伸缩方案,提高了应用稳定性和资源利用率。
166 7
|
11月前
|
运维 关系型数据库 调度
想一套Dataphin管理云上云下的集群和数据?“注册调度集群”来帮忙!
在实际业务场景中,部分企业在云上和云下(本地机房)都存在集群和数据库,企业期望通过一套Dataphin同时对这些集群和数据库进行管理,如何有效解决数据跨网络传输带来的安全性低和流量成本高的问题是其中的关键。为了解决上述问题,Dataphin推出“注册调度集群”功能,帮助企业实现一套Dataphin管理云上云下的集群和数据。
191 5
|
12月前
|
资源调度 运维 Kubernetes
Dataphin实时研发任务资源预估与资源配置
在企业用户使用Dataphin的实时研发模块时,有两个基本问题是必须考虑的: 1. 短期上线一个实时业务,需要准备多少资源?企业在未来一年中,需要提前准备多少服务器/云资源? 2. 上线实时任务时,怎么配置需要的资源? 本文对这两个问题做简单介绍,期望企业用户能够快速理解资源预估原理和资源配置方法。
251 5
|
7月前
|
弹性计算 人工智能 Serverless
阿里云ACK One:注册集群云上节点池(CPU/GPU)自动弹性伸缩,助力企业业务高效扩展
在当今数字化时代,企业业务的快速增长对IT基础设施提出了更高要求。然而,传统IDC数据中心却在业务存在扩容慢、缩容难等问题。为此,阿里云推出ACK One注册集群架构,通过云上节点池(CPU/GPU)自动弹性伸缩等特性,为企业带来全新突破。
|
5月前
|
SQL 弹性计算 分布式计算
阿里云 EMR 发布托管弹性伸缩功能,支持自动调整集群大小,最高降本60%
阿里云开源大数据平台 E-MapReduce 重磅推出托管弹性伸缩功能,基于 EMR 托管弹性伸缩功能,您可以指定集群的最小和最大计算限制,EMR 会持续对与集群上运行的工作负载相关的关键指标进行采样,自动调整集群大小,以获得最佳性能和资源利用率。
254 15

热门文章

最新文章

下一篇
oss创建bucket