文档备案控制台

开发者社区大数据与机器学习实时计算 Flink 正文

FlinkSQL数据同步任务，为什么老是运行大概2~3天会内存超限，最后被Yarn Kill掉？

我们的FlinkSQL数据同步任务，从kafka(ogg-json)同步到StarRocks，资源配置是JM 1G，TM 1G，单并行度，数据量也不大（单日500W），为什么老是运行大概2~3天会内存超限，最后Container被Yarn Kill掉呢？这个里面也没有用到状态相关的。

展开

收起

三分钟热度的鱼 2023-08-29 19:44:03 431 版权

版权声明：本文内容由阿里云实名注册用户自发贡献，版权归原作者所有，阿里云开发者社区不拥有其著作权，亦不承担相应法律责任。具体规则请查看《阿里云开发者社区用户服务协议》和《阿里云开发者社区知识产权保护指引》。如果您发现本社区中有涉嫌抄袭的内容，填写侵权投诉表单进行举报，一经查实，本社区将立刻删除涉嫌侵权内容。

1 条回答

写回答

取消提交回答

清风拂袖

FlinkSQL数据同步任务内存超限，可能有多种原因，需要结合具体场景进行分析。以下是一些常见的原因：

数据量过大。如果数据量过大，FlinkSQL任务可能无法及时处理，导致内存超限。
任务并发度过高。如果任务并发度过高，每个 TaskManager 的任务数量过多，导致内存消耗过快。
算子处理时间过长。如果某些算子的处理时间过长，导致任务整体处理时间过长，导致内存消耗过大。
数据格式不兼容。如果数据格式不兼容，FlinkSQL任务可能无法正常处理数据，导致内存消耗过大。
如果出现内存超限的问题，可以通过以下方式进行解决：

调整数据量。如果数据量过大，可以调整数据量或拆分数据，以降低内存消耗。
降低并发度。如果并发度过高，可以降低并发度，以降低内存消耗。
优化算子。如果某些算子的处理时间过长，可以优化算子或重写算子，以降低处理时间。
转换数据格式。如果数据格式不兼容，可以转换数据格式，以便 FlinkSQL 任务正常处理数据。
如果您仍然无法解决问题，请联系 Flink 官方支持人员。

希望以上信息能对您有所帮助。

2023-09-28 10:29:21

赞同展开评论

问答分类：

消息中间件资源调度 Kafka 容器实时计算 Flink版云消息队列 Kafka 版

问答标签：

内存运行运行内存任务Yarn 数据同步任务 flinksql Yarn

问答地址：

开发者社区 > 大数据与机器学习 > 实时计算 Flink > 问答

相关问答

实时计算 Flink版

dataworks部分定时任务显示任务异常退出，但是上yarn上显示任务运行成功这个是什么原因呢？

224

1

0

flinksql 提交yarn session 总是提交到本地集群

751

1

0

请问FLINK-SQL作业sql文件怎样能运行 yarn-application 模式?

367

1

0

flink cdc 为啥我从2.4升到3.1.1，在yarn上运行会有问题?

269

0

0

可观测体系能监控DTS数据同步任务和ClickHouse的内存使用预警吗？

197

1

0

如何使用阿里云监控平台确保DTS数据同步任务和ClickHouse集群的稳定运行与资源管理？

285

0

0

flink sql-client.sh yarn-per-job 运行完成后不退出

425

0

0

在Flink任务失败自动无状态重启为什么会偶尔导致内存不足呢？

264

1

0

请教一下，flink如何在flink-conf文件中配置往yarn上提交的用户

988

1

0

Flink On Yarn模式，有办法可以固定jobmanager.rpc.port端口吗？

3146

4

0

大数据与机器学习

实时计算 Flink

实时计算Flink版是阿里云提供的全托管Serverless Flink云服务，基于 Apache Flink 构建的企业级、高性能实时大数据处理系统。提供全托管版 Flink 集群和引擎，提高作业开发运维效率。

我要提问

相关文章

BidFans系统竞拍出价模式的设计与技术实现

阿里云国际站：为什么函数计算自定义镜像启动失败？

改了副本，原件也跟着变？Python拷贝的坑我帮你踩过了

2026年阿里云服务器热门配置价格：5款高性价比云服务器配置与适用场景解析

热门讨论

热门文章

Flink CDC任务从savepoint/checkpoints状态中恢复作业错误问题

Flink CDC 能适配达梦不？

有用flink cdc同步mysql到hive这样搞过的源码吗?

flink1.19和hive3.1.3，cdc从mysql同步数据到hive，插入时报错？

Flink CDC里这个问题怎么解决？

flinkcdc在IDEA运行正常，打包就报错

哪位有编译好的cdc 2.2.0版本能能试用flink 1.14.2的包呀？

Flink 1.13版本升级Flink 1.17 报错有人知道为什么吗?

FLink 1.13版本升级Flink 1.17 报错，怎么处理？

FLink 1.13版本升级Flink 1.17 报错，怎么解决？

展开全部

独家专访阿里集团副总裁贾扬清：我为什么选择加入阿里巴巴？

通过Flink实时构建搜索引擎的索引

Flume+Kafka+Flink+Redis构建大数据实时处理系统：实时统计网站PV、UV展示

阿里云实时计算产品案例&解决方案汇总

流计算精品翻译: The Dataflow Model

接着！！Apache Flink 全领域干货合集（持续更新）

Flink SQL 功能解密系列 —— 流式 TopN 挑战与实现

广告场景下的实时计算

Flink SQL 功能解密系列 —— 流计算“撤回(Retraction)”案例分析

如何在 PyFlink 1.10 中自定义 Python UDF？

展开全部

还有其他疑问?