Flink有个时间节点 数据会猛的进来 导致反压,然后 检查点失败,任务重跑怎么办?
增加并行度。增加并行度可以减少每个子任务处理的数据量,从而降低反压的风险。
调整检查点间隔。将检查点间隔缩短可以减少检查点失败时丢失的数据量。
使用事件时间语义。事件时间语义可以确保数据按照事件发生的时间顺序处理,从而避免数据乱序导致的反压。
使用水位线。水位线可以帮助 Flink 确定哪些数据已经处理完成,哪些数据还没有处理完成,从而避免反压。
使用反压策略。Flink 提供了多种反压策略,可以根据不同的场景选择合适的反压策略来避免反压。
版权声明:本文内容由阿里云实名注册用户自发贡献,版权归原作者所有,阿里云开发者社区不拥有其著作权,亦不承担相应法律责任。具体规则请查看《阿里云开发者社区用户服务协议》和《阿里云开发者社区知识产权保护指引》。如果您发现本社区中有涉嫌抄袭的内容,填写侵权投诉表单进行举报,一经查实,本社区将立刻删除涉嫌侵权内容。
实时计算Flink版是阿里云提供的全托管Serverless Flink云服务,基于 Apache Flink 构建的企业级、高性能实时大数据处理系统。提供全托管版 Flink 集群和引擎,提高作业开发运维效率。