备案控制台

开发者社区大数据与机器学习实时计算 Flink 正文

大佬们我flink yarn-per-job模式任务中间失败了自动重启了重启这段时间的数据丢失了

大佬们我flink yarn-per-job模式任务中间失败了自动重启了重启这段时间的数据丢失了怎么办这种问题如何排查任务失败原因

展开

收起

游客3oewgrzrf6o5c 2022-07-07 14:50:49 762 版权

版权声明：本文内容由阿里云实名注册用户自发贡献，版权归原作者所有，阿里云开发者社区不拥有其著作权，亦不承担相应法律责任。具体规则请查看《阿里云开发者社区用户服务协议》和《阿里云开发者社区知识产权保护指引》。如果您发现本社区中有涉嫌抄袭的内容，填写侵权投诉表单进行举报，一经查实，本社区将立刻删除涉嫌侵权内容。

1 条回答

写回答

取消提交回答

三掌柜666

十分耕耘，一定会有一分收获！
楼主你好，在阿里云Flink中，如果使用yarn-per-job模式运行作业，遇到任务中间失败后自动重启，重启过程中可能会导致部分数据丢失。为了避免数据丢失，可以考虑以下几点：
1. 在Flink应用程序中实现数据恢复机制：通过实现Flink应用程序中的Checkpoint机制和Operator State机制，可以实现数据的自动备份和恢复，避免数据丢失。
2. 配置Flink应用程序的重启策略：可以通过配置Flink应用程序的重启策略，来控制任务在重启时的行为。例如，可以设置最大尝试次数和重试间隔等参数，以避免频繁的重启和数据丢失。
3. 排查任务失败原因：如果任务中间失败后自动重启，可以通过Flink Web UI或日志文件等方式，来查看任务失败的原因和具体的错误信息。常见的任务失败原因包括网络异常、资源不足、代码逻辑错误等，需要根据具体的情况进行排查和修复。
在排查任务失败原因时，可以考虑以下几个方面：
1. 查看Flink应用程序的日志文件，了解任务执行过程中的细节和异常情况。
2. 使用Flink Web UI查看任务的状态和运行情况。
3. 分析任务失败的堆栈信息和错误日志，找出具体的失败原因和异常情况。
4. 调整任务的配置参数，例如并发度、资源分配等，以优化任务的执行效率和稳定性。
需要注意的是，在排查任务失败原因时，需要对Flink应用程序、YARN集群和底层资源等方面都进行细致的分析和排查，以找出具体的问题和解决方案。
2023-07-23 11:28:45

赞同展开评论

问答分类：

流计算实时计算 Flink版

问答标签：

实时计算 Flink版任务实时计算 Flink版模式任务实时计算 Flink版模式实时计算 Flink版重启实时计算 Flink版任务重启

问答地址：

开发者社区 > 大数据与机器学习 > 实时计算 Flink > 问答

相关问答

实时计算 Flink版

Flink CDC中通过yarn-per-job 其他任务都在ACCEPTED状态？

164

0

0

Flink CDC yarn-per 模式提交flink任务，这个是什么情况？

128

3

0

flink yarn-per-job提交这个是什么问题吗，主机端口都是正常的，就报了拒绝连接？

228

1

0

Flink CDC任务能正常提交到yarn 这个0.0.0.0:8030能用什么参数修正呀？

92

1

0

Flink CDC中如果我设置了checkpoint操作，然后我的任务失败了，在yarn上面已经没？

132

1

0

flink sql-client.sh yarn-per-job 运行完成后不退出

271

0

0

在Flink CDC中flink-cdc整库同步任务能不能指定yarn-session的id提交？

120

1

0

Flink使用单作业模式提交任务到yarn，出现这个错误怎么解决呀？

132

1

0

flink 任务提交yarn 执行，yarn log有以上堆栈报错，是什么原因哈？有遇到过的吗？

188

1

0

Flink CDC里oracle-cdc 使用 xstream ，为啥提交任务到 yarn 上报错？

154

0

0

大数据与机器学习

实时计算 Flink

实时计算Flink版是阿里云提供的全托管Serverless Flink云服务，基于 Apache Flink 构建的企业级、高性能实时大数据处理系统。提供全托管版 Flink 集群和引擎，提高作业开发运维效率。

我要提问

收录在圈子:

阿里云实时计算Flink

199215

+ 订阅

实时计算 Flink 版（Alibaba Cloud Realtime Compute for Apache Flink，Powered by Ververica）是阿里云基于 Apache Flink 构建的企业级、高性能实时大数据处理系统，由 Apache Flink 创始团队官方出品，拥有全球统一商业化品牌，完全兼容开源 Flink API，提供丰富的企业级增值功能。

相关文章

在 OpenAI 打造流处理平台：超大规模实时计算的实践与思考

数据管道别裸奔！聊聊单元、集成、端到端测试的“三层护体”玩法

数据慢半拍，问题可能不在“数据”：聊聊数据传播延迟的那些坑

Flink + Fluss 实战: Delta Join 原理解析与操作指南

Flink + Fluss 实战: Delta Join 原理解析与操作指南

热门讨论

热门文章

Flink1.17为什么需要JDK 11呢？JDK8我试了也能运行

Flink CDC 人大金仓能作为source吗？支持bin-log吗？

Flink CDC任务从savepoint/checkpoints状态中恢复作业错误问题

flink cdc同步的源表，一定要有主键么？

Flink CDC把主表先全量同步到索引中更新到索引中这种怎么搞？

flink cdc source端能降低消费速度嘛？

我使用flink cdc StartupOptions.latest() 采最新的日志。要是程序挂了

flink datastream ，向clickhouse插入数据时怎么关闭插入时更新,

请问一下Flink mysqlcdc获取到数据之后关联结果不更新这个怎么办?

Flink CDC有知道Mac m1下的docker 环境如何开启sqlserver代理吗？

展开全部

Flink 基础详解：大数据处理的强大引擎

Flink CDC：基于 Apache Flink 的流式数据集成框架

Apache Paimon统一大数据湖存储底座

从 Flink 到 Doris 的实时数据写入实践 —— 基于 Flink CDC 构建更实时高效的数据集成链路

Flink CDC：新一代实时数据集成框架

数据仓库介绍与实时数仓案例

Flink Agents：基于Apache Flink的事件驱动AI智能体框架

Delta Join：为超大规模流处理实现计算与历史数据解耦

Apache Flink 零基础入门（一）：基础概念解析

如何为Kafka加上账号密码（二）

展开全部

还有其他疑问?