Dataphin实时研发任务资源预估与资源配置

简介: 在企业用户使用Dataphin的实时研发模块时,有两个基本问题是必须考虑的:1. 短期上线一个实时业务,需要准备多少资源?企业在未来一年中,需要提前准备多少服务器/云资源?2. 上线实时任务时,怎么配置需要的资源?本文对这两个问题做简单介绍,期望企业用户能够快速理解资源预估原理和资源配置方法。

在企业用户使用Dataphin的实时研发模块时,有两个基本问题是必须考虑的:

  1. 短期上线一个实时业务,需要准备多少资源?企业在未来一年中,需要提前准备多少服务器/云资源?
  2. 上线实时任务时,怎么配置需要的资源?

本文对这两个问题做简单介绍,期望企业用户能够快速理解资源预估原理和资源配置方法。

Flink 引擎基本概念

Dataphin实时研发对接Flink引擎,在不同环境下引擎版本、内核不同,但是都有相同的基本概念。在了解Dataphin实时研发任务资源预估和配置前,需要企业用户的运维部门同事对Flink的这些概念有基本了解:

配置项

说明

CU

CU对应实时计算底层系统的CPU计算能力1 CU=1核CPU+4 GiB内存

JobManager CPU/Memory

建议您配置为1 Core和4 GiB。根据Flink最佳实践,单个JM资源需要至少配置为0.25 Core和1 GiB,才能保证作业稳定运行。

TaskManager CPU/Memory

建议您配置为1 Core和4 GiB。根据Flink最佳实践,单个TM内存资源需要至少配置为0.25 Core和1 GiB,才能保证作业稳定运行。单个TM资源,建议不高于16Core/64GiB

并发度

作业全局并发数。根据Flink最佳实践,并发度可以设置为等于集群节点可用CPU的核心数量。

TaskManager 数量

请填入整数。 

从上表的说明,可以看出有两个明显的约束:

  1. 集群总体资源约束:                   TaskManager数量 * TaskManager Memory < = 集群总的内存可用资源
  2. 单个TaskManager资源约束:  [设置的并发数/TaskManager 数量]  <=单个TaskManager CPU Core

Dataphin实时研发资源预估

一个Dataphin实时研发作业(Job)的CU使用量取决于此Job输入数据流的QPS、计算复杂程度,以及具体的输入数据分布情况。您可以根据业务规模以及实时计算的计算能力,估算所需购买的资源数量。

实时研发 1 CU的处理能力如下表所示:

处理场景

处理能力

简单的流式计算处理

例如,过滤、清洗等操作。

1 CU每秒可以处理5000条数据。

复杂的流式计算处理

例如,聚合操作、复杂UDF计算等。

1 CU每秒可以处理1000条数据。

上述计算能力估值仅限于实时计算内部处理能力,不包括对外数据读取和写入部分。外部数据的读写效率会影响您对实时计算能力的评估。

举例:

客户的输入数据流的QPS是12000,并且期间做了比较复杂的聚合,按照上面的文档:

TaskManager的CU数量:12000/1000 = 12             可以设置TaskManager数量为3,每个为 4Core/16GiB

JobManager的CU数量:2

该任务总共的资源消耗:2+12=12 CU=  14 Core + 56 GiB    这个就是运维部门需要准备预留的资源总量。

Dataphin实时研发资源配置

开源Flink模式:

当使用的是开源Flnk计算源时,Dataphin对任务的资源配置做了简化,如下图:

在预估了资源总量后,Dataphin中可以配置TaskManager的数量和Memory、Job Manager的Memory,另外可以配置并发度。

如果是使用Yarn集群,这块资源是需要在Yarn集群中预留的资源;如果是使用K8s集群,这块资源在 Dataphin的资源调度集群中预留。

VVP模式:

当使用的是VVP计算源时,Dataphin对任务的资源配置做了进一步的简化和细化,如下图:

在配置Job Manager的CPU和Memory后,用户可以选择资源配置类型为 “系统推荐配置”和“自定义配置”。初级用户可以直接按系统推荐配置操作;对Flink引擎的内存模型非常熟悉的企业用户,可以按自定义配置来做细粒度的内存使用控制。

相关实践学习
基于Hologres+Flink搭建GitHub实时数据大屏
通过使用Flink、Hologres构建实时数仓,并通过Hologres对接BI分析工具(以DataV为例),实现海量数据实时分析.
实时计算 Flink 实战课程
如何使用实时计算 Flink 搞定数据处理难题?实时计算 Flink 极客训练营产品、技术专家齐上阵,从开源 Flink功能介绍到实时计算 Flink 优势详解,现场实操,5天即可上手! 欢迎开通实时计算 Flink 版: https://cn.aliyun.com/product/bigdata/sc Flink Forward Asia 介绍: Flink Forward 是由 Apache 官方授权,Apache Flink Community China 支持的会议,通过参会不仅可以了解到 Flink 社区的最新动态和发展计划,还可以了解到国内外一线大厂围绕 Flink 生态的生产实践经验,是 Flink 开发者和使用者不可错过的盛会。 去年经过品牌升级后的 Flink Forward Asia 吸引了超过2000人线下参与,一举成为国内最大的 Apache 顶级项目会议。结合2020年的特殊情况,Flink Forward Asia 2020 将在12月26日以线上峰会的形式与大家见面。
相关文章
|
11月前
|
SQL Java 关系型数据库
Dataphin功能Tips系列(53)-离线集成任务如何合理配置JVM资源
本文探讨了将MySQL数据同步至Hive时出现OOM问题的解决方案。
332 5
|
7月前
|
数据采集 调度
Dataphin功能Tips系列(74)质量规则调度配置系列(1)-数据更新触发调度
在数据生产中,数据质量直接影响业务准确性。Dataphin 提供“数据更新触发调度”功能,结合强规则校验,可在数据更新时自动检测质量,异常时阻断下游任务,防止脏数据扩散,保障数据准确性与流程稳定。
147 0
|
9月前
|
SQL 数据可视化
Dataphin功能Tips系列(66)- 如何配置技术指标关系图
Dataphin通过可视化技术指标关系图,帮助业务人员快速理解指标加工逻辑。
172 2
|
9月前
|
数据可视化
Dataphin功能Tips系列(68)如何配置业务指标关系图
Dataphin推出“业务指标关系图”功能,通过可视化方式直观展示业务指标拆解关系,帮助技术人员与业务人员快速对齐指标口径,提升开发效率。以GMV为例,用户可在系统中新建指标、添加关联指标并配置关系表达式,系统自动生成多层级关系图,便于理解和协作,实现指标开发透明化与一致性。
215 0
|
11月前
|
弹性计算 Kubernetes 调度
Dataphin V5.0:调度资源支持弹性伸缩,有效提升资源利用率
Dataphin在5.0版本新增“调度资源弹性伸缩”功能,通过设置资源组的Min(保障资源)和Max(上限资源),优化资源共享逻辑,提升集群资源利用率。方案涵盖三种资源分配场景,并支持查看实时使用量。
318 16
|
SQL 调度
如何基于Dataphin智能研发开发“留存率”指标
用户留存率是指在互联网行业中,某段时间内新增用户中,在后续特定时间点或时间段内继续使用应用的用户比例。它是衡量应用质量和用户保留能力的重要指标。 本文为您介绍如何基于Dataphin规范建模结合SQL加工能力进行留存率指标开发。
434 11
|
11月前
|
数据安全/隐私保护
Dataphin V4.5:批量导入导出目录及资产信息配置,提升资产盘点效率
数据资产运营常需跨部门协作,使用在线文档梳理信息并快速录入系统至关重要。Dataphin 支持通过 Excel 模板批量导入专题、目录及资产配置,大幅提升效率。场景包括:1) 专题目录初始化配置,快速完成多层级目录定义;2) 批量修改专题目录,适配组织结构调整;3) 批量修改资产信息,实现线上协同编辑与更新。系统还提供异常预检与高亮提示,确保导入准确性,助力高效资产盘点与运营。
314 0
|
SQL 分布式计算 资源调度
Dataphin功能Tips系列(48)-如何根据Hive SQL/Spark SQL的任务优先级指定YARN资源队列
如何根据Hive SQL/Spark SQL的任务优先级指定YARN资源队列
465 4
|
分布式计算 监控 Java

热门文章

最新文章

下一篇
开通oss服务