有没有老哥碰到过ck失败后自 动重启一直不成功?

已解决

有没有老哥碰到过ck失败后自 动重启一直不成功?每一次ck失败的第一次自动重启就报taskManager超内存,然后就挂了。jobManager和taskManager都看了也没看出啥名堂。。。我的ck是rocksDb全量式ck,昨天运行的时候看ck数据还是1g左右,按道理连续两次ck失败然后自动重启报超内存应该就是一个固定错误了吧,超内存报错信息:“2023-03-22 05:24:16,467 INFO org.apache.flink.runtime.resourcemanager.active.ActiveResourceManager [] - Worker container_e194_1676649102918_19840_01_000002 is terminated. Diagnostics: [2023-03-22 05:24:13.399]Container [pid=269993,containerID=container_e194_1676649102918_19840_01_000002] is running 23228416B beyond the 'PHYSICAL' memory limit. Current usage: 2.0 GB of 2 GB physical memory used; 4.4 GB of 4.2 GB virtual memory used. Killing container.”

展开
收起
圆葱猪肉包 2023-03-27 13:57:07 331 分享 版权
1 条回答
写回答
取消 提交回答
  • 从错误看是内存使用超限了,看看tm的内存模型有没有异常,另外确认下作业有没有反压

    2023-03-28 18:01:26
    赞同 展开评论

实时计算Flink版是阿里云提供的全托管Serverless Flink云服务,基于 Apache Flink 构建的企业级、高性能实时大数据处理系统。提供全托管版 Flink 集群和引擎,提高作业开发运维效率。

收录在圈子:
实时计算 Flink 版(Alibaba Cloud Realtime Compute for Apache Flink,Powered by Ververica)是阿里云基于 Apache Flink 构建的企业级、高性能实时大数据处理系统,由 Apache Flink 创始团队官方出品,拥有全球统一商业化品牌,完全兼容开源 Flink API,提供丰富的企业级增值功能。
还有其他疑问?
咨询AI助理