开发者社区 > 大数据与机器学习 > 实时计算 Flink > 正文

Flink重启失败怎么解决?

Flink重启失败怎么解决?有个任务,没设置checkpoint,其中某一个源表70万数据,每天会删了重刷,有时候任务扛不住就会无状态重启,一般重启都会成功,但时不时(大概一周会有一天)会重启失败,检查发现内存爆满了,但平时内存冗余很多lQLPJwzXq807ODfNAR_NBMmw5nHh98avNsYGiP8MmUpcAA_1225_287.png
平时运行的内存情况
lQLPJwPi1cIcvL_NApnNBKSweWtjPIiNU6EGiOteCWJPAA_1188_665.png
lQLPKcmlr9HRNj_NAbbNBL-wLTHNgpZNsYMGiOtql2NSAA_1215_438.png
重启失败时的任务和内存情况

展开
收起
三分钟热度的鱼 2024-07-31 20:39:32 29 0
1 条回答
写回答
取消 提交回答
  • 根据目前的作业情况来看,一是内存设置的过期时间太长,导致内存太多,所以有时候会重启失败;二是现存的资源太少,这个作业也有自动调优,有可能会因为资源超量导致失败
    此回答整理自钉群“实时计算Flink产品外部客户交流群”

    2024-07-31 22:31:01
    赞同 11 展开评论 打赏

实时计算Flink版是阿里云提供的全托管Serverless Flink云服务,基于 Apache Flink 构建的企业级、高性能实时大数据处理系统。提供全托管版 Flink 集群和引擎,提高作业开发运维效率。

相关产品

  • 实时计算 Flink版
  • 相关电子书

    更多
    Flink CDC Meetup PPT - 龚中强 立即下载
    Flink CDC Meetup PPT - 王赫 立即下载
    Flink CDC Meetup PPT - 覃立辉 立即下载