Flink on YARN 多 Session 集群能力:让小任务共享大资源,实现实时计算降本增效

简介: Dataphin推出FlinkonYARN多Session集群能力,支持小任务共享资源池、多业务隔离及秒级提交,显著降低实时计算资源消耗与运维成本。

背景

在 Flink on YARN 部署模式下,企业实时计算任务的资源消耗长期面临核心痛点:每个 Flink 任务以 Per-Job 或 Application 模式独立启动时,均需单独申请 JobManager 和 TaskManager 资源,对于大量小数据量的采集类任务(如维表同步、低频变更数据抓取等),存在严重的资源浪费问题。此前,数据研发人员常需为每个小任务配置独立的计算资源,不仅导致集群资源碎片化、利用率低下,还使得整体资源成本居高不下,严重影响企业实时计算场景的投资回报率。

为破解这一核心痛点,Dataphin 在 Flink on YARN 部署模式下推出「多 Session 集群」能力,支持企业创建多个 Session 集群作为共享计算资源池,Flink 任务可复用已启动的 Session 集群进行提交运行。该能力专为小数据量、低频次、状态管理诉求不高的任务设计,通过资源共享大幅降低资源消耗,同时保障多业务场景下的任务资源隔离,为企业实时计算场景实现降本增效提供有力支撑。

核心价值

资源共享复用,显著降低资源消耗

针对维表同步、低频变更数据抓取等小数据量采集任务,多 Session 集群模式允许多个任务复用同一组 JobManager / TaskManager 资源,避免了 Per-Job / Application 模式下每个任务独立申请资源带来的开销。通过资源池化共享,大幅减少集群资源碎片,提升整体资源利用率,有效降低企业的实时计算资源成本。

多集群隔离保障,适配多业务场景

支持创建多个 Session 集群,不同业务线可按需分配独立的 Session 集群资源。各业务线的任务运行在自己的 Session 集群内,实现任务级别的资源隔离,避免业务间相互影响。同时,多集群架构支持按业务维度进行资源Quota管控,保障核心业务的资源供给,适配企业多业务并存的复杂场景。

简化任务运维,提升研发效率

Session 集群预先启动并保持运行状态,任务提交时无需等待资源申请和集群启动过程,实现秒级任务提交与运行。对于状态管理诉求不高的小任务,研发人员无需关注底层资源调度细节,只需在任务配置中选择目标 Session 集群即可,显著降低实时任务的运维复杂度,让数据研发人员更聚焦于业务逻辑开发。

产品功能

新增「Session 集群管理」模块,支持在 Flink on YARN 部署模式下创建、配置和管理多个 Session 集群,实时任务在新建时可选择 Session 集群作为运行资源。

Session 集群管理

支持在 Dataphin 平台上进行 Session 集群的全生命周期管理:

  • 集群创建:支持配置 Session 集群的基础参数,包括集群名称、YARN 队列、JobManager / TaskManager 内存与 CPU 资源规格、Slot 数量等;
  • 集群监控:提供 Session 集群运行状态的实时监控能力,展示集群资源使用率、任务运行数量、Slot 占用情况等关键指标,便于运维人员掌握集群健康状态;
  • 集群启停:支持 Session 集群的手动启动与停止操作,集群停止后相关资源自动释放,灵活控制资源占用周期。

实时任务提交选择 Session 集群

  • 在 Flink 实时任务新建与编辑场景中,支持选择 Session 集群作为任务运行资源:
  • 资源选择:任务配置页面资源队列,支持选择「yarn 队列」或「Session 集群」;
  • 集群绑定:可从已创建的 Session 集群列表中选择目标集群,任务将提交至该集群运行;
  • 任务隔离:同一 Session 集群内的多个任务通过 Slot 机制实现资源隔离,保障任务间互不干扰,稳定运行。

总结

本次上线的「Flink 1.20 on YARN 多 Session 集群」能力,聚焦企业实时计算场景中小任务资源浪费的核心痛点,通过 Session 集群资源共享复用、多集群业务隔离、简化任务运维等机制,实现小数据量采集类任务的降本增效。企业无需为每个小任务独立申请资源,即可大幅降低实时计算的资源消耗与运维成本,同时保障多业务场景下的资源隔离与稳定运行。

欢迎大家前来体验~

相关文章
|
21天前
|
数据采集 人工智能 数据可视化
从数据到知识:Dataphin 知识图谱,重新定义企业智能决策
Dataphin知识图谱助力企业从PB级数据迈向可理解、可推理、可决策的知识智能。它深度融合数据研发体系,支持可视化建模、结构化/非结构化数据双通道入图、Schema全生命周期管理及GraphRAG问答,真正实现“数据即知识”。
342 0
从数据到知识:Dataphin 知识图谱,重新定义企业智能决策
|
21天前
|
人工智能 运维 数据可视化
非结构化数据处理,为什么是Dataphin?
Dataphin V6.1重磅推出非结构化数据处理能力,支持文档、音视频、图片等多模态数据的一站式资产化治理:提供7类50+开箱即用算子、可视化DAG编排、文件+元数据混合管理、细粒度权限与动态脱敏,实现与结构化数据统一治理、血缘追踪和版本管控。
254 2
|
4月前
|
Kubernetes 调度 流计算
Flink on Kubernetes 自定义镜像能力:让企业存量实时任务零成本迁移,实现统一平台管控
Dataphin推出Flink on Kubernetes自定义镜像能力,支持企业直接复用存量业务镜像与K8s配置,零代码改造、零环境风险完成实时任务迁移,实现“业务不动、管控升级”,兼顾稳定性与平台化治理。
176 0
|
4月前
|
SQL 分布式计算 关系型数据库
Dataphin功能Tips系列(92)如何方便快速地通过SQL取数实现定制化数据同步
本文介绍如何在Dataphin中实现MySQL到MaxCompute的T-1增量数据同步:通过离线集成任务,将MySQL输入组件切换为脚本模式,利用`querySql`配合`${extract_date}`动态参数(默认`${yyyy-MM-dd}`),精准抽取前一日订单数据,配置调度后即可全自动运行。
282 5
|
4月前
|
数据可视化 定位技术
Dataphin功能Tips系列(94)Dataphin 构建外部数据系统血缘统一管理解决方案(1)
Dataphin支持通过OpenAPI注册外部系统血缘,补全全链路数据地图断点。提供BY_GUID/BY_PROPERTY两种方式,支持表级与字段级血缘纳管及可视化展示,助力血缘追溯与影响分析。
213 1
|
4月前
|
数据可视化 定位技术
Dataphin功能Tips系列(96)Dataphin 构建外部数据系统血缘统一管理解决方案(2)
Dataphin通过OpenAPI支持外部系统血缘纳管,可基于Catalog/Schema/Env等属性组合注册表级与字段级血缘,补全全链路数据地图,实现跨系统血缘可视化与影响分析。
186 1
|
4月前
Dataphin登录系统重磅升级:界面化SSO配置、多账号登录功能上线
Dataphin V6.0推出界面化SSO配置与多账号体系登录功能,支持CAS、OAuth2.0、SAML、飞书等多种协议,解决旧版配置复杂、不支持多源登录等痛点,提升企业单点登录体验与管理效率。
345 0
|
4月前
|
数据采集 运维 监控
Dataphin功能Tips系列(95)如何自定义Dataphin告警消息
Dataphin监控告警支持离线/实时任务、数据质量及服务的全链路异常检测,可基于规则自动触发告警。提供灵活的消息模板自定义能力,支持按事件类型、渠道(如钉钉机器人)配置内容,集成任务名、负责人、日志URL等元数据,提升告警精准性与响应效率。
181 2
|
8月前
|
SQL 关系型数据库 MySQL
释放数据潜能,加速业务创新 —— Dataphin 5.4 新增删改API功能
Dataphin 5.4推出数据增删改API功能,支持通过配置SQL快速生成安全、可管理的CRUD接口,覆盖AI编程、数据集成、低代码等场景,降低开发成本,提升数据治理与安全性,助力企业高效释放数据价值。
480 0
|
SQL 人工智能 分布式计算
【产品升级】Dataphin V5.3 全新上线:四大能力升级,数据管理更统一、更智能!
V5.3版本,Dataphin推出众多重磅功能:例如,全新的智能应用:X-数据标准、X-数据安全以及智能应用反馈看板;更前沿的数据研发能力:利用SelectDB/Doris/StarRocks查询加速Hive和MaxCompute的离线引擎、全面支持Paimon格式的数据湖构建;资产运营和数据服务持续提效。
786 0