开发者社区 > 大数据与机器学习 > 实时计算 Flink > 正文

服务器上启动了一个Flink流处理作业,运行近一个月时间后,没有发现异常?

服务器上启动了一个Flink流处理作业,运行近一个月时间后,发现个别task manager进程突然挂掉了。

该作业的数据流量较大,当前task manager的资源配置为:

Physical Memory: 4GB
JVM Heap Size: 1.56GB
Flink Managed Memory: 1.35GB
在task manager挂掉后,我检查了其日志文件,但是没有找到明显的异常信息,如OOM等。云平台的监控也没有发现CPU或内存使用异常。

已采取的排查步骤:

检查了task manager日志文件,没有明显异常
检查了云平台的CPU和内存监控,没有发现异常?好像是这里的原因image.png

展开
收起
cuicuicuic 2023-10-18 16:49:32 28 0
0 条回答
写回答
取消 提交回答

实时计算Flink版是阿里云提供的全托管Serverless Flink云服务,基于 Apache Flink 构建的企业级、高性能实时大数据处理系统。提供全托管版 Flink 集群和引擎,提高作业开发运维效率。

相关产品

  • 实时计算 Flink版
  • 相关电子书

    更多
    如何运维千台以上游戏云服务器 立即下载
    网站/服务器取证 实践与挑战 立即下载
    ECS块储存产品全面解析 立即下载