开发者社区 > 大数据与机器学习 > 实时计算 Flink > 正文

FlinkSQL数据同步任务,为什么老是运行大概2~3天会内存超限,最后被Yarn Kill掉?

我们的FlinkSQL数据同步任务,从kafka(ogg-json)同步到StarRocks,资源配置是JM 1G,TM 1G,单并行度,数据量也不大(单日500W),为什么老是运行大概2~3天会内存超限,最后Container被Yarn Kill掉呢?这个里面也没有用到状态相关的。6bee1338fd969bc01e54c0fb320aa8a1.png

展开
收起
三分钟热度的鱼 2023-08-29 19:44:03 205 0
1 条回答
写回答
取消 提交回答
  • FlinkSQL数据同步任务内存超限,可能有多种原因,需要结合具体场景进行分析。以下是一些常见的原因:

    数据量过大。如果数据量过大,FlinkSQL任务可能无法及时处理,导致内存超限。
    任务并发度过高。如果任务并发度过高,每个 TaskManager 的任务数量过多,导致内存消耗过快。
    算子处理时间过长。如果某些算子的处理时间过长,导致任务整体处理时间过长,导致内存消耗过大。
    数据格式不兼容。如果数据格式不兼容,FlinkSQL任务可能无法正常处理数据,导致内存消耗过大。
    如果出现内存超限的问题,可以通过以下方式进行解决:

    调整数据量。如果数据量过大,可以调整数据量或拆分数据,以降低内存消耗。
    降低并发度。如果并发度过高,可以降低并发度,以降低内存消耗。
    优化算子。如果某些算子的处理时间过长,可以优化算子或重写算子,以降低处理时间。
    转换数据格式。如果数据格式不兼容,可以转换数据格式,以便 FlinkSQL 任务正常处理数据。
    如果您仍然无法解决问题,请联系 Flink 官方支持人员。

    希望以上信息能对您有所帮助。

    2023-09-28 10:29:21
    赞同 展开评论 打赏

实时计算Flink版是阿里云提供的全托管Serverless Flink云服务,基于 Apache Flink 构建的企业级、高性能实时大数据处理系统。提供全托管版 Flink 集群和引擎,提高作业开发运维效率。

相关电子书

更多
内存取证与IaaS云平台恶意行 为的安全监控 立即下载
云服务器ECS内存增强型实例re6全新发布 立即下载
MaxCompute技术公开课第四季 之 如何将Kafka数据同步至MaxCompute 立即下载