文档备案控制台

开发者社区大数据与机器学习实时计算 Flink 正文

哪位老师遇到过flink on yarn per-job模式HA zk不重新选举JobManager

43832这个端口号是被Kill掉的Job Manager 449问.png 449问问.png 449问问问.png

展开

收起

游客3oewgrzrf6o5c 2022-06-28 11:18:01 611 版权

版权声明：本文内容由阿里云实名注册用户自发贡献，版权归原作者所有，阿里云开发者社区不拥有其著作权，亦不承担相应法律责任。具体规则请查看《阿里云开发者社区用户服务协议》和《阿里云开发者社区知识产权保护指引》。如果您发现本社区中有涉嫌抄袭的内容，填写侵权投诉表单进行举报，一经查实，本社区将立刻删除涉嫌侵权内容。

1 条回答

写回答

取消提交回答

三掌柜666

十分耕耘，一定会有一分收获！
楼主你好，在使用阿里云Flink on YARN per-job模式时，如果启用了HA（高可用）模式，并且使用了Zookeeper进行协调，那么在一个Job Manager节点挂掉后，Zookeeper应该会重新进行选举，选出一个新的Job Manager节点来接管作业。如果您发现在一个Job Manager节点被Kill掉后，Zookeeper没有重新选举新的Job Manager节点，可能是以下几个原因导致的：
1. Zookeeper集群状态异常：如果Zookeeper集群状态异常，例如某个Zookeeper节点挂掉，可能会导致Zookeeper无法正常进行选举。建议您检查Zookeeper集群状态，并确保Zookeeper集群正常运行。
2. Flink on YARN per-job模式配置异常：如果Flink on YARN per-job模式的配置存在异常，例如Zookeeper地址配置错误或者HA模式配置错误，可能会导致Zookeeper无法正常进行选举。建议您检查Flink on YARN per-job模式的配置，以确保配置正确无误。
3. 作业状态异常：如果作业状态异常，例如作业未正确关闭，可能会导致Zookeeper无法正常进行选举。建议您检查作业状态，以确保作业正常关闭。
关于43832端口号被Kill掉的Job Manager，这可能是由于某个作业执行失败或者某个Job Manager节点出现故障而导致的。当Flink on YARN per-job模式中的一个Job Manager节点挂掉时，Zookeeper应该会重新选举新的Job Manager节点来接管作业。如果Zookeeper没有进行重新选举，可能是以上所述的原因导致的。

如果您需要进一步排查问题，建议您查看Flink on YARN per-job模式的日志，以便了解更多关于作业状态和Zookeeper选举的信息。您也可以尝试重新启动Flink on YARN per-job模式，并确保Zookeeper集群正常运行，以便解决问题。
2023-07-23 13:01:40

赞同展开评论

问答分类：

资源调度流计算实时计算 Flink版

问答标签：

实时计算 Flink版模式实时计算 Flink版Yarn flink Yarn模式 Yarn模式实时计算 Flink版JobManager

问答地址：

开发者社区 > 大数据与机器学习 > 实时计算 Flink > 问答

相关问答

实时计算 Flink版

在Flink CDC中,使用Flink HA模式可以做到flink集群重启后自动恢复运行的job吗？

162

1

0

使用Flink HA模式可以做到flink集群重启后自动恢复正在运行的job吗？

189

0

0

ZooKeeper 网络瞬断时，Flink JobManager 会遇到什么问题，以及这是如何影响

399

1

0

K8S部署的Flink如何配JobManager和TaskManager的日志？

346

0

0

Flink在HA模式，重启ZK集群，客户端任务提交异常（疑似脑裂)

269

0

0

Flink的vvp有支持standby JobManager么？用于JM crash时作业快速恢复

178

1

0

Flink JobManager功能有哪些

187

1

0

在Flink CDC中提交任务jobmanager能起来，taskmanager起不来，如何解决？

193

0

0

Flink CDC里flink Application Mode模式有必要部署 HA吗？

239

2

0

Flink k8s HA 锁资源在etcd偶发出现写失败时候，请教一下这个机制有优化的配置吗？

227

1

0

大数据与机器学习

实时计算 Flink

实时计算Flink版是阿里云提供的全托管Serverless Flink云服务，基于 Apache Flink 构建的企业级、高性能实时大数据处理系统。提供全托管版 Flink 集群和引擎，提高作业开发运维效率。

我要提问

收录在圈子:

阿里云实时计算Flink

199214

+ 订阅

实时计算 Flink 版（Alibaba Cloud Realtime Compute for Apache Flink，Powered by Ververica）是阿里云基于 Apache Flink 构建的企业级、高性能实时大数据处理系统，由 Apache Flink 创始团队官方出品，拥有全球统一商业化品牌，完全兼容开源 Flink API，提供丰富的企业级增值功能。

相关文章

专访｜GEO落地工程师罗长才：地理感知网络底座如何构建XR全链路技术闭环

GPT-5.6全量发布：智能体的工程范式发生了哪些变化

ComfyUI插件：ComfyUI-BrushNet节点（附带COMFYUI安装教程文章）

企业出海如何构建高效稳定的数字化基础设施多平台协同管理实践解析

阿里云表格存储Tablestore对接使用完全指南：从入门到实战

热门讨论

热门文章

Flink CDC任务从savepoint/checkpoints状态中恢复作业错误问题

Flink CDC 能适配达梦不？

flink1.19和hive3.1.3，cdc从mysql同步数据到hive，插入时报错？

有用flink cdc同步mysql到hive这样搞过的源码吗?

flinkcdc在IDEA运行正常，打包就报错

哪位有编译好的cdc 2.2.0版本能能试用flink 1.14.2的包呀？

在Flink想实时汇总数据，类似数据大屏功能，应该用阿里云Flink的什么功能服务？

那cdc最新版支持到flink的哪个版本，flink1.15还有guava兼容性问题吗？

咨询下各位大佬，用Flink CDC 2.2.0同步MYSQL数据库，库表是latin1编码的时候？

如何用实时数据同步打破企业数据孤岛？

展开全部

流计算精品翻译: The Dataflow Model

Apache Flink 零基础入门（一）：基础概念解析

仅1年GitHub Star数翻倍，Flink 做了什么？

Lyft 基于 Flink 的大规模准实时数据分析平台（附FFA大会视频）

在 Cloudera Data Flow 上运行你的第一个 Flink 例子

首届！Apache Flink 极客挑战赛强势来袭，重磅奖项等你拿，快来组队报名啦

Apache Flink 1.9重磅发布！首次合并阿里内部版本Blink重要功能

58 集团大规模 Storm 任务平滑迁移至 Flink 的秘密

State Processor API：如何读取，写入和修改 Flink 应用程序的状态

Apache Flink 在同程艺龙实时计算平台的研发与应用实践

展开全部

还有其他疑问?