备案控制台

开发者社区大数据与机器学习实时计算 Flink 正文

请问大佬们，对flink进行压测，每条数据大小为160B，在1728核和960G内存的资源下，最大吞

请问大佬们，对flink进行压测，每条数据大小为160B，在1728核和960G内存的资源下，最大吞吐量为1800万/S。估算数据量7000万/S，每条数据大小为300B，需要配置的并发度和内存资源，是要用什么方式估算更合理，有这方面的资料吗

展开

收起

游客3oewgrzrf6o5c 2022-08-22 17:38:53 895 版权

版权声明：本文内容由阿里云实名注册用户自发贡献，版权归原作者所有，阿里云开发者社区不拥有其著作权，亦不承担相应法律责任。具体规则请查看《阿里云开发者社区用户服务协议》和《阿里云开发者社区知识产权保护指引》。如果您发现本社区中有涉嫌抄袭的内容，填写侵权投诉表单进行举报，一经查实，本社区将立刻删除涉嫌侵权内容。

1 条回答

写回答

取消提交回答

爱吃白菜的GGB
对于Flink进行压测并估算所需的并发度和内存资源，可以考虑以下几个方面：
1. 根据数据量和每条数据大小，计算所需的总内存。对于7000万/S，每条数据大小为300B，总内存大小为2.1TB。因此，需要至少配备2.1TB的内存资源。需要注意的是，这只是一个估算值，实际内存需求还要考虑Flink的运行环境、任务类型和数据处理逻辑等因素。
2. 根据最大吞吐量和每条数据大小，计算所需的并发度。对于每条数据大小为300B的情况，可以根据最大吞吐量1800万/S，计算出每个实例（即每个Flink TaskManager）需要处理600个数据包（300B/160B*1800万/S）才能达到最大吞吐量。假设每个实例的并发度为100，则需要至少70个TaskManager实例才能满足需求。
3. 针对实际情况进行调整。根据实际情况，需要根据任务类型、数据处理逻辑、数据源和目的地等因素进行调整。例如，如果数据源和目的地是分布式存储系统，需要考虑网络带宽和I/O等因素；如果数据处理逻辑较为复杂，需要增加内存资源和并发度等。
需要注意的是，以上计算只是一个初步估算，实际情况可能会有所不同。建议在实际使用过程中，根据具体情况进行调整和优化。同时，Flink官方也提供了一些性能调优和优化的建议和方法，可以参考相关资料。
2023-06-13 18:46:25

赞同展开评论

问答分类：

测试技术流计算实时计算 Flink版性能测试

问答标签：

内存资源实时计算 Flink版数据数据内存内存数据实时计算 Flink版资源

问答地址：

开发者社区 > 大数据与机器学习 > 实时计算 Flink > 问答

相关问答

实时计算 Flink版

flink有什么压测功能吗

122

1

0

flink cdc怎么进行压测呀？

149

0

0

在性能测试中，RSS所使用的内存大小是多少，占机器总内存的百分比是多少？

202

1

0

Serverless 应用引擎 SAE 压测的时候，CPU和内存都没上次，但是测试效果上不去怎么办？

89

0

0

flink CDC处理数据，记录每条数据的变更大家是用什么技术实现的？

218

1

0

Flink处理数据，记录每条数据的变更大家是用什么技术实现的？

188

2

0

flink cdc 每秒同步记录数这个官方有相关压测的文档吗？

126

1

0

Flink 从kafka中消费到数据到map里每条转换json对象太耗时，有什么好的解决办法吗？

204

2

0

Flink这个函数好像是有bug，每条数据content都是有t这个字段的。怎么回事？

77

1

0

Flink CDC中我们做压测，如果只是insert非常快，目标是kafka，源端mysql，如果？

164

1

0

大数据与机器学习

实时计算 Flink

实时计算Flink版是阿里云提供的全托管Serverless Flink云服务，基于 Apache Flink 构建的企业级、高性能实时大数据处理系统。提供全托管版 Flink 集群和引擎，提高作业开发运维效率。

我要提问

收录在圈子:

阿里云实时计算Flink

199214

+ 订阅

实时计算 Flink 版（Alibaba Cloud Realtime Compute for Apache Flink，Powered by Ververica）是阿里云基于 Apache Flink 构建的企业级、高性能实时大数据处理系统，由 Apache Flink 创始团队官方出品，拥有全球统一商业化品牌，完全兼容开源 Flink API，提供丰富的企业级增值功能。

相关文章

阿里云服务器38元、99元和199元一年配置价格，轻量和ECS云服务器使用场景说明

【赵渝强老师】Redis数据的迁移

Playwright不稳定的原因揭晓：经历12个坑后的深刻领悟！

单位电脑监控软件的 Node.js 哈希表日志去重算法

氛围编程走远，规格驱动开发降临

热门讨论

热门文章

Flink CDC任务从savepoint/checkpoints状态中恢复作业错误问题

Flink1.17为什么需要JDK 11呢？JDK8我试了也能运行

FlinkCDC MySQL 中 scan.startup.mode 用的是什么模式啊？

大佬有遇见过这个错误的吗？连接kerberos的kafka的时候失败

有大佬遇到过flink web ui上的指标都是loading状态吗，flink版本是1.17.1？

在Flink中Job Manager CPU设置为1，Memory设置为8G，它是算1CU还是什么？

Flink CDC里用jdbc往达梦dm8推数据，老是显示字符被截断是咋回事？有人碰到过嘛？

在斗鱼，实时计算发展的历程如何？

debezium 可以正常读取做到数据同步，但是无法持久化表结构元数据

Flink CDC中，有哪位大佬有flink 版本和cdc版本的适配统计啊？

展开全部

数据仓库介绍与实时数仓案例

流计算StreamCompute

Flume+Kafka+Flink+Redis构建大数据实时处理系统：实时统计网站PV、UV展示

流计算精品翻译: The Dataflow Model

回顾 | Kafka x Flink Meetup 与世界人工智能大会大数据 AI 专场精彩回顾（附PPT下载）

Flink SQL 功能解密系列 —— 流式 TopN 挑战与实现

Flink Checkpoint 问题排查实用指南

广告场景下的实时计算

如何在 PyFlink 1.10 中自定义 Python UDF？

使用 Kafka 和 Flink 构建实时数据处理系统

展开全部

还有其他疑问?