Hi, 各位大佬们,请教几个问题: 背景:Flink程序在正常运行过程中由于某些原因抛出异常了(比如数据不正确、NullPointer等),设置了checkpoint,程序默认会无限重启,都没办法savepoint。 问题1: Flink希望开发者怎么处理程序的异常? 问题2:checkpoint是否可以转化为savepoint,使得在没来得及savepoint之前能够进行恢复? 问题3:如果我某条数据导致了异常,怎么样才忽略这条数据而不影响应用的状态和运行?
*来自志愿者整理的flink邮件归档
1.生产环境中一般都需要try catch捕获异常,因为无法保证上游数据完全没有问题 2.程序默认无限重启代表你的数据有问题,重复处理错误数据,重复失败重启,根本原因还是在错误数据这里 3.某条数据出现异常,try catch + 加perf log + 加监控(报警)等
*来自志愿者整理的flink邮件归档
版权声明:本文内容由阿里云实名注册用户自发贡献,版权归原作者所有,阿里云开发者社区不拥有其著作权,亦不承担相应法律责任。具体规则请查看《阿里云开发者社区用户服务协议》和《阿里云开发者社区知识产权保护指引》。如果您发现本社区中有涉嫌抄袭的内容,填写侵权投诉表单进行举报,一经查实,本社区将立刻删除涉嫌侵权内容。