文档备案控制台

开发者社区大数据与机器学习实时计算 Flink 正文

Flink 1.15.2 内存已经调整到15GB了，每秒600多条数据。这个有什么好的方式解决吗？

Flink 1.15.2, Flink MySql CDC 2.4.1. MySql中有一张表，其中一列是longtext, 存的值长度都很长，大部分1MB以上，有的几十MB. CDC的时候，只要有这个表就OOM，内存已经调整到15GB了，每秒600多条数据。这个有什么好的方式解决吗？java.lang.OutOfMemoryError: GC overhead limit exceeded

展开

收起

真的很搞笑 2023-09-06 18:21:36 291 版权

版权声明：本文内容由阿里云实名注册用户自发贡献，版权归原作者所有，阿里云开发者社区不拥有其著作权，亦不承担相应法律责任。具体规则请查看《阿里云开发者社区用户服务协议》和《阿里云开发者社区知识产权保护指引》。如果您发现本社区中有涉嫌抄袭的内容，填写侵权投诉表单进行举报，一经查实，本社区将立刻删除涉嫌侵权内容。

1 条回答

写回答

取消提交回答

清风拂袖

如果您的 Flink 任务每秒处理的数据量较大，并且已经将内存调整到 15GB 但仍然无法满足需求，可以考虑以下几种方式来解决问题：

增加集群资源：如果您的集群规模允许，可以增加 Flink 集群的计算资源，例如增加 TaskManager 的数量或增加 TaskManager 的内存大小，以提高整体的处理能力。

调整任务并行度：可以尝试增加 Flink 任务的并行度，将数据并行处理在多个任务实例上，以提高整体的处理吞吐量。通过增加并行度，可以让任务更好地利用集群资源。

优化算子和数据结构：检查任务中的算子实现和数据结构，优化代码逻辑和数据处理方式。例如，使用更高效的算法、数据结构和算子，减少不必要的内存开销和计算复杂度。

调整窗口和水位线策略：如果任务中使用了窗口操作和水位线策略，可以根据实际需求和数据特点，调整窗口大小和水位线的生成逻辑，以减少数据的存储和计算开销。

分区和数据本地性：根据数据的分布情况，合理划分任务的分区策略，将相关的数据分配到同一个任务实例上，以减少数据的网络传输和跨节点的通信开销。

使用异步 IO 和批量提交：如果任务需要与外部系统进行交互，可以考虑使用异步 IO 或批量提交的方式来减少每条数据的交互成本，提高整体的处理效率。

评估数据量和处理需求：重新评估数据量和处理需求，确保调整后的资源配置能够满足实际的数据处理要求。如果数据量持续增加，可能需要进一步调整和优化资源配置。

需要注意的是，每个应用的情况可能不同，解决问题的方式也会有所差异。建议根据具体的场景和需求，结合实际的性能监控和调优分析，在多个方面进行综合优化，以获得更好的性能和吞吐量。

另外，可以根据具体情况参考 Flink 的官方文档和社区资源，了解更多有关性能调优和资源管理的最佳实践。

2023-10-23 11:51:44

赞同展开评论

问答分类：

关系型数据库 MySQL Java 流计算实时计算 Flink版云数据库 RDS MySQL 版

问答标签：

实时计算 Flink版数据内存gb 内存数据实时计算 Flink版内存内存flink

问答地址：

开发者社区 > 大数据与机器学习 > 实时计算 Flink > 问答

相关问答

实时计算 Flink版

请问 flink1.14.5 的home目录下的tmp目录存储过于大，几十GB~几百GB,有没有？

717

1

0

手上只有 16gb 内存的电脑，怎么学习 ai 大模型算法，怎么加入 ai 大模型的开发公司中？

447

1

0

2核2GB内存的服务器适合搭建个人网站吗？

295

1

0

2核2GB内存的服务器跑静态网站流畅吗？

542

1

0

租用2核2GB内存的阿里云服务器一般用于哪些场景？

335

1

0

小型企业使用4GB内存的服务器能支撑日常业务吗？

317

1

0

2核CPU、2GB内存、4Mbps带宽的轻量服务器性能如何？

354

1

0

2GB内存服务器推荐用哪个版本的windows server？

282

1

0

阿里云服务器系统盘20GB 装完linux 还剩下多少内存？

367

2

0

Tair持久内存版如何保证数据的实时持久化？

240

1

0

大数据与机器学习

实时计算 Flink

实时计算Flink版是阿里云提供的全托管Serverless Flink云服务，基于 Apache Flink 构建的企业级、高性能实时大数据处理系统。提供全托管版 Flink 集群和引擎，提高作业开发运维效率。

我要提问

相关文章

智慧班牌源代码

我眼里的 AI Agent Harness

当 PostgreSQL 坐稳数据底座，Agent 还差什么才能真正跑起来？

商品详情优化三板斧-拆分-多级缓存-GC调参

当 80% 的数据库由 AI 自动创建，我们需要一个什么样的 PostgreSQL？

相关解决方案

更多

基于数据闪回，快速恢复数据

海量异构数据预处理破局之道

多模态数据信息提取

分析 Agent 实现一键 AI 数据洞察

高效存储和处理多媒体数据

热门讨论

热门文章

Flink CDC任务从savepoint/checkpoints状态中恢复作业错误问题

Flink CDC刚刚写了几条数据，但是里面有点问题，其他字段都是正常的。这是咋回事呀？

哪位有编译好的cdc 2.2.0版本能能试用flink 1.14.2的包呀？

Flink cdc sqlserver 希望不同步某些数据行

Flink CDC 能适配达梦不？

Segment Key主要应用在哪些场景？

flinkcdc在IDEA运行正常，打包就报错

Flink CDC中，有哪位大佬有flink 版本和cdc版本的适配统计啊？

有人遇到flink打不开web界面吗？

Apache Flink未授权访问上传导致的RCE漏洞，这个漏洞目前方案解决吗？

展开全部

数据仓库介绍与实时数仓案例

独家专访阿里集团副总裁贾扬清：我为什么选择加入阿里巴巴？

实时计算 Flink SQL 核心功能解密

流计算StreamCompute

阿里云实时计算产品案例&解决方案汇总

流计算精品翻译: The Dataflow Model

接着！！Apache Flink 全领域干货合集（持续更新）

回顾 | Kafka x Flink Meetup 与世界人工智能大会大数据 AI 专场精彩回顾（附PPT下载）

Flink SQL 功能解密系列 —— 流式 TopN 挑战与实现

广告场景下的实时计算

展开全部

还有其他疑问?