文档备案控制台

开发者社区大数据与机器学习实时计算 Flink 正文

Apache Flink从开发到生产上线的过程中，我们应该如何确定集群规划大小？

Apache Flink从开发到生产上线的过程中，我们应该如何确定集群规划大小？或者说有什么依据作为参考？

展开

收起

Lee_tianbai 2020-12-30 10:41:33 1709 版权

版权声明：本文内容由阿里云实名注册用户自发贡献，版权归原作者所有，阿里云开发者社区不拥有其著作权，亦不承担相应法律责任。具体规则请查看《阿里云开发者社区用户服务协议》和《阿里云开发者社区知识产权保护指引》。如果您发现本社区中有涉嫌抄袭的内容，填写侵权投诉表单进行举报，一经查实，本社区将立刻删除涉嫌侵权内容。

2 条回答

写回答

取消提交回答

leonyoung

java底层技术、分布式数据库设计、深度学习算法
1. 取决业务涉及到数据规模，比如使用kafka，那么kafka的入口流量qps
2. 如果涉及到聚合，还需考虑状态更新次数
2021-03-04 13:34:59

赞同展开评论
Lee_tianbai

第一步是仔细考虑应用程序的运维指标，以达到所需资源的基线。需要考虑的关键指标是： ● 每秒记录数和每条记录的大小 ● 已有的不同键（key）的数量和每个键对应的状态大小 ● 状态更新的次数和状态后端的访问模式最后，一个更实际的问题是与客户之间围绕停机时间、延迟和最大吞吐量的服务级别协议（sla），因为这些直接影响容量规划。接下来，根据预算，看看有什么可用的资源。例如： ● 网络容量，同时把使用网络的外部服务也纳入考虑，如 Kafka、HDFS 等。 ● 磁盘带宽，如果您依赖于基于磁盘的状态后端，如 RocksDB（并考虑其他磁盘使用，如 Kafka 或 HDFS） ● 可用的机器数量、CPU 和内存基于所有这些因素，现在可以为正常运行构建一个基线，外加一个资源缓冲量用于恢复追赶或处理负载尖峰。建议您在建立基线时也考虑检查点期间（checkpoint- ing）使用的资源情况。

2020-12-30 10:42:58

赞同展开评论

问答分类：

Apache 流计算实时计算 Flink版

问答标签：

Apache flink 实时计算 Flink版Apache 实时计算 Flink版开发实时计算 Flink版集群 Apache上线

问答地址：

开发者社区 > 大数据与机器学习 > 实时计算 Flink > 问答

相关问答

实时计算 Flink版

Flink + Iceberg数据湖解决方案在小米的未来规划是什么？

221

1

0

Flink更新UDF时会不会影响已使用该UDF的上线作业

187

1

0

flink的elasticsearch8连接器上线了吗？

211

2

0

这就是Flink即将上线的调度功能吗？

200

2

0

Flink CDC已经上线的任务，后续进行表结构变更新增字段，这种对数据没啥影响吧？

313

1

0

未来在 Flink CDC 写入 Hudi 的技术上有哪些规划？

213

1

0

Flink Table Store项目的中期规划包括哪些内容？

155

1

0

Flink CDC 社区对哪些数据库的支持在规划中？

229

1

0

在数据集成方面，Flink CDC 有什么具体的规划？

219

1

0

Flink CDC 社区接下来的主要规划方向有哪些？

186

1

0

大数据与机器学习

实时计算 Flink

实时计算Flink版是阿里云提供的全托管Serverless Flink云服务，基于 Apache Flink 构建的企业级、高性能实时大数据处理系统。提供全托管版 Flink 集群和引擎，提高作业开发运维效率。

我要提问

收录在圈子:

阿里云实时计算Flink

199215

+ 订阅

实时计算 Flink 版（Alibaba Cloud Realtime Compute for Apache Flink，Powered by Ververica）是阿里云基于 Apache Flink 构建的企业级、高性能实时大数据处理系统，由 Apache Flink 创始团队官方出品，拥有全球统一商业化品牌，完全兼容开源 Flink API，提供丰富的企业级增值功能。

相关文章

Arduino IDE下载安装和汉化一篇搞定（2026最新）

EMR + Flink 实战：从离线T+1到实时数仓的完整迁移路径

Hologres + Flink 实时OLAP分析实战：从T+1报表到秒级洞察的数据平台

蚂蚁百灵发布 Ling-3.0-Flash 原生混合推理模型，124B 参数对标 1T 旗舰

相关解决方案

更多

JManus解锁AI Agent高效开发

Flink 与 Hologres 搭建实时数仓

企业云上网络架构规划

Flink CDC 实现企业级实时数据同步

使用kubectl-ai助力ACK集群运维提效

热门讨论

热门文章

Flink CDC刚刚写了几条数据，但是里面有点问题，其他字段都是正常的。这是咋回事呀？

Flink CDC任务从savepoint/checkpoints状态中恢复作业错误问题

Flink cdc sqlserver 希望不同步某些数据行

哪位有编译好的cdc 2.2.0版本能能试用flink 1.14.2的包呀？

Segment Key主要应用在哪些场景？

Flink CDC 能适配达梦不？

flinkcdc在IDEA运行正常，打包就报错

有人遇到flink打不开web界面吗？

Flink CDC中，有哪位大佬有flink 版本和cdc版本的适配统计啊？

有用flink cdc同步mysql到hive这样搞过的源码吗?

展开全部

数据仓库介绍与实时数仓案例

通过Flink实时构建搜索引擎的索引

Flink SQL 功能解密系列 —— 流式 TopN 挑战与实现

Apache Flink 的迁移之路，2 年处理效果提升 5 倍

Flink SQL 功能解密系列 —— 流计算“撤回(Retraction)”案例分析

如何在 PyFlink 1.10 中自定义 Python UDF？

基于Flink的实时日志分析系统实践

阿里巴巴高级技术专家章剑锋：大数据发展的 8 个要点

深入了解 Flink 网络栈（二）：监控、指标和处理背压

运维场景下的实时计算应用

展开全部

还有其他疑问?