文档备案控制台

开发者社区大数据与机器学习实时计算 Flink 正文

Flink 在任务执行前我也不知道这个任务需要多少的内存，这个有什么解决方法吗?

Flink on yarn任务在执行的时候数据量太大容易jobmanager或者taskmanager内存不足，然后容器直接被kill掉，在任务执行前我也不知道这个任务需要多少的内存，这个有什么解决方法吗?

展开

收起

真的很搞笑 2023-11-30 13:07:14 228 版权

版权声明：本文内容由阿里云实名注册用户自发贡献，版权归原作者所有，阿里云开发者社区不拥有其著作权，亦不承担相应法律责任。具体规则请查看《阿里云开发者社区用户服务协议》和《阿里云开发者社区知识产权保护指引》。如果您发现本社区中有涉嫌抄袭的内容，填写侵权投诉表单进行举报，一经查实，本社区将立刻删除涉嫌侵权内容。

2 条回答

写回答

取消提交回答

芯在这

先按集群资源算算按cpu和内存配比给，然后报溢出了再加，从ck恢复就行，此回答整理自钉群“【③群】Apache Flink China社区”

2023-11-30 21:43:20

赞同展开评论
小周sir

面对过去，不要迷离；面对未来，不必彷徨；活在今天，你只要把自己完全展示给别人看。
当 Flink 在 YARN 上运行时，由于数据量大而导致 JobManager 或 TaskManager 内存不足的情况是很常见的。以下是一些解决此类问题的方法：
1. 增加资源：
  
  增加每个 TaskManager 的内存大小：通过 yarn.application-master.vcores 和 yarn.container-vcores 设置来调整分配给任务的 CPU 核心数。
  增加 TaskManager 的数量：在提交作业时指定更多的并行度（如使用 -yn 参数）。
2. 监控和调优：
  
  使用 Flink Web UI 监控作业状态，包括 TaskManager 的资源使用情况、水位线等指标。
  调整 checkpoint 间隔和超时时间，以降低系统开销。
3. 优化数据处理逻辑：
  
  减少 state 的使用，或者使用更高效的状态存储方式（如 RocksDB）。
  对于高并发的数据流，考虑使用分桶、分区等技术来分散数据负载。
4. 预估资源需求：
  
  在实际部署前进行测试，根据测试结果估计所需资源。
  可以使用一些工具（如 Apache JMeter 等）模拟生产环境中的数据流量，以此来预估资源需求。
5. 动态资源调整：
  
  使用 Flink 自带的 dynamic scaling 功能，在作业运行过程中动态地添加或减少 TaskManagers。
  配合 YARN 的动态资源调整功能，自动扩展集群规模。
6. 使用外部持久化存储：
  
  如果可能，将部分计算过程产生的中间数据保存到外部持久化存储（如 HDFS），而不是全部保留在内存中。
7. 升级硬件：
  
  如果当前硬件资源不足以应对大数据量的处理，可以考虑升级服务器的硬件配置。
8. 使用高效的序列化库：
  
  使用高效的序列化库（如 Protobuf、Kryo 等）来降低数据传输和存储的成本。
2023-11-30 13:17:17

赞同展开评论

问答分类：

流计算容器资源调度实时计算 Flink版

问答标签：

实时计算 Flink版任务实时计算 Flink版内存任务内存内存解决方法实时计算 Flink版任务内存

问答地址：

开发者社区 > 大数据与机器学习 > 实时计算 Flink > 问答

相关问答

实时计算 Flink版

Flink中流任务和批任务内存申请是如何进行的

199

1

0

应用实时监控服务创建内存快照一直显示任务已发布

155

1

0

可观测体系能监控DTS数据同步任务和ClickHouse的内存使用预警吗？

189

1

0

如何使用阿里云监控平台确保DTS数据同步任务和ClickHouse集群的稳定运行与资源管理？

264

0

0

在Flink任务失败自动无状态重启为什么会偶尔导致内存不足呢？

258

1

0

DataWorks提交任务到 emr 集群跑的时候，在哪里可以设置内存资源？

347

13

0

modelscope-funasr内存一直增加的问题有什么好解决方法么？

188

0

0

flink报错给的解决方法是这个，但是rds又不支持设置这几个参数该怎么办啊？

222

0

0

Flink CDC中 sql server 部分最近发现一个问题，还有别的解决方法么？

284

0

0

DataWorks运行任务报以下错误，能通过调整第二图里面执行命令的内存和cpu 来解决吗？

216

1

0

大数据与机器学习

实时计算 Flink

实时计算Flink版是阿里云提供的全托管Serverless Flink云服务，基于 Apache Flink 构建的企业级、高性能实时大数据处理系统。提供全托管版 Flink 集群和引擎，提高作业开发运维效率。

我要提问

相关文章

把运维能力装进 Qoder，一句话就能定位根因

不仅听懂，更能干活：看张之阳如何让 Agent 安全接管智能家居

可回收垃圾目标检测数据集：3类别 | 目标检测

AI 英语学习软件开发流程

热门讨论

热门文章

Flink CDC任务从savepoint/checkpoints状态中恢复作业错误问题

哪位有编译好的cdc 2.2.0版本能能试用flink 1.14.2的包呀？

Flink CDC 能适配达梦不？

flinkcdc在IDEA运行正常，打包就报错

有用flink cdc同步mysql到hive这样搞过的源码吗?

flink1.19和hive3.1.3，cdc从mysql同步数据到hive，插入时报错？

如何用实时数据同步打破企业数据孤岛？

在Flink想实时汇总数据，类似数据大屏功能，应该用阿里云Flink的什么功能服务？

咨询下各位大佬，用Flink CDC 2.2.0同步MYSQL数据库，库表是latin1编码的时候？

Flink CDC2.4.1的版本sqlserver支持指定时间戳消费了吗？

展开全部

数据仓库介绍与实时数仓案例

独家专访阿里集团副总裁贾扬清：我为什么选择加入阿里巴巴？

实时计算 Flink SQL 核心功能解密

流计算StreamCompute

Flume+Kafka+Flink+Redis构建大数据实时处理系统：实时统计网站PV、UV展示

流计算精品翻译: The Dataflow Model

接着！！Apache Flink 全领域干货合集（持续更新）

回顾 | Kafka x Flink Meetup 与世界人工智能大会大数据 AI 专场精彩回顾（附PPT下载）

Flink SQL 功能解密系列 —— 流式 TopN 挑战与实现

Apache Flink 的迁移之路，2 年处理效果提升 5 倍

展开全部

还有其他疑问?