开发者社区 > 大数据与机器学习 > 实时计算 Flink > 正文

有没有老哥碰到过ck失败后自 动重启一直不成功?

已解决

有没有老哥碰到过ck失败后自 动重启一直不成功?每一次ck失败的第一次自动重启就报taskManager超内存,然后就挂了。jobManager和taskManager都看了也没看出啥名堂。。。我的ck是rocksDb全量式ck,昨天运行的时候看ck数据还是1g左右,按道理连续两次ck失败然后自动重启报超内存应该就是一个固定错误了吧,超内存报错信息:“2023-03-22 05:24:16,467 INFO org.apache.flink.runtime.resourcemanager.active.ActiveResourceManager [] - Worker container_e194_1676649102918_19840_01_000002 is terminated. Diagnostics: [2023-03-22 05:24:13.399]Container [pid=269993,containerID=container_e194_1676649102918_19840_01_000002] is running 23228416B beyond the 'PHYSICAL' memory limit. Current usage: 2.0 GB of 2 GB physical memory used; 4.4 GB of 4.2 GB virtual memory used. Killing container.”

展开
收起
圆葱猪肉包 2023-03-27 13:57:07 299 0
1 条回答
写回答
取消 提交回答
  • 从错误看是内存使用超限了,看看tm的内存模型有没有异常,另外确认下作业有没有反压

    2023-03-28 18:01:26
    赞同 展开评论 打赏

实时计算Flink版是阿里云提供的全托管Serverless Flink云服务,基于 Apache Flink 构建的企业级、高性能实时大数据处理系统。提供全托管版 Flink 集群和引擎,提高作业开发运维效率。

相关电子书

更多
阿里云 ClickHouse 企业版技术白皮书 立即下载
ClickHouse在手淘流量分析应用实践Jason Xu 立即下载
云数据库clickhouse最佳实践 立即下载