备案控制台

开发者社区问答正文

Job-Manager无法恢复Zookeeper检查点

我们在K8s环境中部署了Flink作业集群（1个作业管理器和1个任务管理器），并将其配置为HA模式（连接到Zookeeper）。该作业是有状态的，并且使用RocksDB后端启用了检查点。问题是从上一个检查点正确恢复了任务管理器重新启动，但作业管理器重新启动不是：

[flink-akka.actor.default-dispatcher-5]recover: 2018-11-27 11:23:26,531 INFO o.a.f.r.c.ZooKeeperCompletedCheckpointStore Recovering checkpoints from ZooKeeper.
[flink-akka.actor.default-dispatcher-5]recover: 2018-11-27 11:23:26,596 INFO o.a.f.r.c.ZooKeeperCompletedCheckpointStore Found 0 checkpoints in ZooKeeper.
[flink-akka.actor.default-dispatcher-5]recover: 2018-11-27 11:23:26,597 INFO o.a.f.r.c.ZooKeeperCompletedCheckpointStore Trying to fetch 0 checkpoints from storage.
检查点将持久保存到Google Cloud Storage和Zookeeper。

相关性能 flink-conf.yaml：

metrics.reporters: prom
metrics.reporter.prom.class: org.apache.flink.metrics.prometheus.PrometheusReporter
high-availability: zookeeper
high-availability.zookeeper.quorum: our-k8s-zookeeper-service:2181
high-availability.zookeeper.path.root: /flink
high-availability.cluster-id: /service_cluster
high-availability.storageDir: gs://our-flink-bucket/namespace/service/ha
high-availability.jobmanager.port: 6123
state.backend.fs.memory-threshold: 0
state.checkpoints.dir: gs://our-flink-bucket/namespace/service/checkpoints

展开

收起

flink小助手 2018-12-11 16:49:08 2076 版权

版权声明：本文内容由阿里云实名注册用户自发贡献，版权归原作者所有，阿里云开发者社区不拥有其著作权，亦不承担相应法律责任。具体规则请查看《阿里云开发者社区用户服务协议》和《阿里云开发者社区知识产权保护指引》。如果您发现本社区中有涉嫌抄袭的内容，填写侵权投诉表单进行举报，一经查实，本社区将立刻删除涉嫌侵权内容。

1 条回答

写回答

取消提交回答

flink小助手

flink小助手会定期更新直播回顾等资料和文章干货，还整合了大家在钉群提出的有关flink的问题及回答。

是Flink 1.6.1中的一个错误，升级到1.6.2就可以。

2019-07-17 23:19:54

赞同展开评论

问答分类：

Kubernetes 流计算容器微服务引擎容器服务Kubernetes版可观测监控 Prometheus 版实时计算 Flink版

问答标签：

微服务引擎检查

问答地址：

开发者社区 > 云原生 > 问答

相关问答

zookeeper 的 leader 服务器再运行期间定时进行会话超时检查的默认值是什么呢？

512

1

0

zookeeper 的 leader 服务器再运行期间定时进行会话超时检查的时间间隔,单位是什么呢？

662

1

0

MSE微服务引擎最近Nacos在凌晨自动重启，请问下是出于什么原因要凌晨重启节点？

172

1

0

MSE微服务引擎为啥响应报文会显示是tengine 的 504 gateway timeout？

192

1

0

MSE微服务引擎网关日志 response_code: 0 啥意思？

339

1

0

请教个问题，MSE微服务引擎 ingress 在helm里面是怎么定义的哇？

90

1

0

MSE微服务引擎印度区关停中，澳洲区也准备关停吗？

176

3

0

MSE微服务引擎注册和配置中心本地调试怎么用？

152

1

0

MSE微服务引擎支持自定义应用层协议的长连接吗？

106

1

0

MSE微服务引擎网关有没有服务编排功能？

133

1

0

问答排行榜

最热

最新

【大咖问答】对话PostgreSQL 中国社区发起人之一，阿里云数据库高级专家德哥

据说在家办公的程序员是这样写代码的？

阿里云开放端口权限

如何升级配置

【藏经阁一起读（27）】本周推荐《Apache Flink案例集（2022版）》，你有哪些心得？

通义灵码提示看起来我们今天已经有了很多的对话，我很感谢你的热情，但我现在需要稍微休息一下。提前抱

阿里云CDN价格表，CDN如何收费的？

CentOS 7安装最新版docker-compose-plugin（2.27.1-1.el7）报错

服务器<details open ontoggle="alert(9);"></details>

通义灵码，文件编辑返回403错误

相关文章

别老想着怎么用好 RPC 框架，你得多花时间琢磨原理

宝塔 Linux 面板 Docker 容器化部署指南

揭开 Java 容器“消失的内存”之谜：云监控 2.0 SysOM 诊断实践

学会检索，快人一步！

状态检索：如何快速判断一个用户是否存在？

还有其他疑问?