文档备案控制台

开发者社区问答正文

Flink任务资源动态规划

大家好：我这边Flink运行是on yarn，任务启动时具体启用几个TM、几个Slot，还有并行度之类的资源配置，目前都是基于个人经验进行配置。我想问一下具体影响Flink任务资源配置的维度有哪些？还有这些维度能不能具体量化出来，经过一定的计算来动态规划资源，应该采用什么方案，从而在平台上减少研发的参与。谢谢大家*来自志愿者整理的flink邮件归档

展开

收起

雪哥哥 2021-12-07 15:57:08 771 版权

版权声明：本文内容由阿里云实名注册用户自发贡献，版权归原作者所有，阿里云开发者社区不拥有其著作权，亦不承担相应法律责任。具体规则请查看《阿里云开发者社区用户服务协议》和《阿里云开发者社区知识产权保护指引》。如果您发现本社区中有涉嫌抄袭的内容，填写侵权投诉表单进行举报，一经查实，本社区将立刻删除涉嫌侵权内容。

1 条回答

写回答

取消提交回答

游客sadna6pkvqnz6

Hi，具体启动几个 TM、这个据我了解在 yarn 上是不支持自动扩缩 TM 个数的，然后启动多少个 Slot，这个主要取决于你的并行度，如果你的 Job 需要这么多并行度来处理数据的话，那么就需要你有这么多 Slot 去支持你开启这么多并行度，因为一个 Job 的并行度最终还是取决于你的 Slot 是否足够，如果 Slot 不够的话，则会报申请 Slot 失败，还有就是你的 Job 并行度怎么设置，一般上线你自己写的 Flink Job 之前最好自己去做一个压测，看看自己 Job 的设置的并行度是否合理，能否及时的处理数据，不会导致数据堆积。在压测时观察 Job 的每个算子处理情况，可能对于有些算子做的任务有点重会导致该算子的处理速度不及时，这种情况就需要调大些并行度，还有就是假如你去消费 MQ Topic 的数据，MQ 有多个分区，如果你数据量小的话，可能一两个并行度也能处理得过来，也就没必要开这么多并行度，如果消费不过来，那么就得慢慢加大到和 MQ Topic 相同分区个数的并行度，再去观察你的 Job 是否能够及时消费（MQ 数据不堆积）。

具体的量化公式，貌似没有，反正整个调优过程，该如何设置并行度、slot、分配多少个 TM，还得根据你实际业务场景的数据量和处理逻辑的复杂性来衡量。这是本人的观点，如果有更好的建议欢迎分享。*来自志愿者整理的flink

2021-12-07 16:27:01

赞同展开评论

问答分类：

流计算实时计算 Flink版

问答标签：

实时计算 Flink版任务实时计算 Flink版资源实时计算 Flink版任务资源

问答地址：

开发者社区 > 大数据 > 问答

相关问答

flink扩容CU资源是否会导致数据丢失？

224

0

0

Flink自动调优最大资源限制是什么

170

1

0

Flink集群误删后台如何恢复项目空间和其中的资源

155

1

0

实时计算Flink如何资源变配

151

1

0

Flink的资源计算方式

180

1

0

flink cdc同步数据的资源，比如内存，cpu这些有什么参考依据吗？

406

11

0

Flink 这种是什么异常，是否是资源给的太低了？

156

0

0

如何解决Flink on K8s集群部署时，K8s实例资源与Flink集群资源不统一的问题？

245

1

0

在Flink CDC中， cdc3.1使用pipeline方式同步，可以在启动命令时加资源参数吗？

211

0

0

在Flink CDC中，有什么方法优化吗？是否只能加资源?

228

0

0

问答排行榜

最热

最新

【大咖问答】对话PostgreSQL 中国社区发起人之一，阿里云数据库高级专家德哥

据说在家办公的程序员是这样写代码的？

如何升级配置

【藏经阁一起读（27）】本周推荐《Apache Flink案例集（2022版）》，你有哪些心得？

【精品问答】python技术1000问(1)

Credits消耗问题

据更新公告Qoder CN哪里提供了每日免费用量，在哪里显示

现在这个token太贵了。买了个人专业版才2000用量，感觉一下用完了

Qoder CN VSCode插件突然提示：您已达到配额使用上限，请升级订阅计划，以获得更多使用资源

在qoder work里面，Qwen3.7出现死循环的情况，失望至极，阿里竟然这样。

相关文章

阿里云实时数仓 Hologres 对接使用完全指南

企业级 RAG 知识库实时计算层选型：AnalyticDB MySQL 向量+SQL 一体化方案

阿里云云原生数据仓库 AnalyticDB PostgreSQL 版对接使用全攻略

AI Agent 出问题时，不要只看最终回答：一次请求级调试的思路

AI 时代，实时入湖正在告别 ETL：从 Kafka 到 Iceberg 的架构减法

还有其他疑问?