备案控制台

开发者社区问答正文

flink为什么可以实现高吞吐？

1、flink是同时实现低延迟和高吞吐？还是在流处理的时候是低延迟低吞吐；在批处理的时候是高延迟高吞吐？ 2、我认为flink没有办法同时实现这两个特性？

展开

收起

游客mpsz4e2mgibqc 2021-12-24 21:56:04 790 版权

版权声明：本文内容由阿里云实名注册用户自发贡献，版权归原作者所有，阿里云开发者社区不拥有其著作权，亦不承担相应法律责任。具体规则请查看《阿里云开发者社区用户服务协议》和《阿里云开发者社区知识产权保护指引》。如果您发现本社区中有涉嫌抄袭的内容，填写侵权投诉表单进行举报，一经查实，本社区将立刻删除涉嫌侵权内容。

阿里云 AI 助理回答

1、Flink 作为流批一体的计算框架，确实能够同时追求低延迟和高吞吐这两个目标，但需注意这两大特性在不同处理模式下的体现有所侧重：

在流处理模式下，Flink 着重于提供低延迟的数据处理能力，即能够快速地对持续不断的无界数据流进行处理，确保数据几乎被实时地分析和响应。尽管追求低延迟，Flink 也设计了诸如窗口机制等特性来平衡吞吐量，实现相对高效的流式数据处理。
在批处理模式中，Flink 的重点则转向了高吞吐量，旨在高效处理大规模的有界数据集。批处理作业通过优化资源分配和并行执行多个阶段，可以达到很高的数据处理速度，尽管这可能相比流处理会有更高的延迟，但并非“高延迟”，而是相对于流处理更注重处理效率和整体完成时间。

2、实际上，您的理解需要修正。Flink 的设计理念在于融合流处理与批处理的能力，力求在不同场景下都能达到最佳性能表现。它并不是简单地在流处理时牺牲吞吐去追求低延迟，或在批处理时接受高延迟以换取高吞吐，而是通过统一的运行时和一系列优化技术（如MiniBatch、LocalGlobal聚合优化等），力图在两种模式下都保持高效。因此，Flink 能够在不同的应用场景下，根据需求调整策略，既追求低延迟也能实现高吞吐，尽管两者之间存在一定的权衡关系。

有帮助

无帮助

AI 助理回答生成答案可能存在不准确，仅供参考

0 条回答

写回答

取消提交回答

问答分类：

流计算实时计算 Flink版

问答标签：

实时计算 Flink版吞吐

问答地址：

开发者社区 > 大数据 > 问答

相关问答

字节跳动在晚高峰时Flink作业处理消息的QPS和Checkpoint高峰流量吞吐分别是多少？

98

1

0

Flink odps吞吐低怎么调整

83

1

0

Flink CDC有测试过mysql-cdc的吞吐率么？单线程每秒大概能获取多少的mysql数据？

306

3

0

flink升级到1.15版本后，jdbc connector 感觉cache没作用了。吞吐下降很多。

195

1

0

各位大佬，请教一下，如果在flink cdc sql客户端使用SQL查询表，怎么能记录原系统的数据

2075

1

0

那cdc最新版支持到flink的哪个版本，flink1.15还有guava兼容性问题吗？

1201

0

0

flink cdc(mysql) -> elasticsearch7, 任务每次持续跑了一段时间之后

1219

2

0

哪位有编译好的cdc 2.2.0版本能能试用flink 1.14.2的包呀？

846

1

0

各位大佬，请教个问题，使用flink cdc读取数据时，如果配置一个表，数据过滤是发生在server

1943

3

0

flink cdc 怎么做断点续传啊

6240

6

0

问答排行榜

最热

最新

【大咖问答】对话PostgreSQL 中国社区发起人之一，阿里云数据库高级专家德哥

据说在家办公的程序员是这样写代码的？

阿里云开放端口权限

如何升级配置

【藏经阁一起读（27）】本周推荐《Apache Flink案例集（2022版）》，你有哪些心得？

“数据超人”MCP工具，到底是怎么让数据‘燃’起来的？

DeepSeek V3.1 昨天还能用tool，今天怎么就用不了了？

我正在搭建智能体，遇到下图问题，不知道怎么解决

用了一年多的lingma 插件，现在.lingma 文件夹有三十多个g，这是正常的吗，是否会继续变大

通义千问和通义千问开源系列有什么区别？

相关文章

抖音基于Flink的DataOps能力实践

【无人机控制】基于TS模糊模型的非线性系统四旋翼无人机跟踪控制研究（Matlab代码实现）

《数据中台隐性故障的排查逻辑与工程化避坑策略》

数据当“安全带”：金融市场如何用大数据玩转风险控制？

使用Koopman理论识别机器人动力学的非线性系统（Matlab代码实现）

还有其他疑问?