flink实时计算任务一段时间后没有数据-阿里云开发者社区

flink实时计算任务一段时间后没有数据

2022-11-18 1309

版权

本文内容由阿里云实名注册用户自发贡献，版权归原作者所有，阿里云开发者社区不拥有其著作权，亦不承担相应法律责任。具体规则请查看《阿里云开发者社区用户服务协议》和《阿里云开发者社区知识产权保护指引》。如果您发现本社区中有涉嫌抄袭的内容，填写侵权投诉表单进行举报，一经查实，本社区将立刻删除涉嫌侵权内容。

简介： flink实时计算任务一段时间后没有数据

问题背景

任务开始运行符合预期,任务运行1.5天后无法在结果表找到后续的数据

分析过程

1.查看日志确定任务堆栈无异常打印

2.使用print表进行测试数据是未进入flink还是在flink中丢失,异常发生时print表的日志正常打印,结果表无数据

3.任务数据丢失的时间都很规律,都是运行到一个固定时间后续的数据丢失,调整ttl时间确定是否时ttl时间到导致状态被清楚

4.调大后发现确实同丢失的数据确实是ttl时间之后的数据

5.检查作业确认逻辑为left join ,左表为静态表 ,将左表改为维表形式使用观察后续数据无异常

方案结论

1.flink全托管的left join为左流驱动,如果左表不能保持跟新则会在ttl到期时间停止任务的驱动,导致后续数据无法join上

2.先修改ttl定位问题。后续建议静态表使用维表的方式来使

实时计算Flink版数据的状态默认保存36小时，如果某个状态超过36小时没有更新，之前的状态可能会被清掉.修改方式如下

ps: 参数名和参数值之间必须要有间隔,没有空格会保存不了该参数设置或者报错

相关实践学习

基于Hologres+Flink搭建GitHub实时数据大屏

通过使用Flink、Hologres构建实时数仓，并通过Hologres对接BI分析工具（以DataV为例），实现海量数据实时分析.

实时计算 Flink 实战课程

如何使用实时计算 Flink 搞定数据处理难题？实时计算 Flink 极客训练营产品、技术专家齐上阵，从开源 Flink功能介绍到实时计算 Flink 优势详解，现场实操，5天即可上手！欢迎开通实时计算 Flink 版： https://cn.aliyun.com/product/bigdata/sc Flink Forward Asia 介绍： Flink Forward 是由 Apache 官方授权，Apache Flink Community China 支持的会议，通过参会不仅可以了解到 Flink 社区的最新动态和发展计划，还可以了解到国内外一线大厂围绕 Flink 生态的生产实践经验，是 Flink 开发者和使用者不可错过的盛会。去年经过品牌升级后的 Flink Forward Asia 吸引了超过2000人线下参与，一举成为国内最大的 Apache 顶级项目会议。结合2020年的特殊情况，Flink Forward Asia 2020 将在12月26日以线上峰会的形式与大家见面。

flink实时计算任务一段时间后没有数据

问题背景

分析过程

方案结论

阿里云支持与服务

热门文章

最新文章

相关课程

相关电子书

相关实验场景

探索云世界

热门

云计算

大数据

云原生

人工智能

数据库

开发与运维

活动广场

任务中心

训练营

直播

乘风者计划

下载

镜像站

技术资料

flink实时计算任务一段时间后没有数据

问题背景

分析过程

方案结论

阿里云支持与服务

热门文章

最新文章

相关课程

相关电子书

相关实验场景