"
是什么原因导致一些CP节省了预期的大小(大约500kB),有些CP的大小在整个当前管理状态大小附近,即使负载是恒定的?
使用增量检查点时,lastCheckpointSize指标的确切测量结果是什么?
"
版权声明:本文内容由阿里云实名注册用户自发贡献,版权归原作者所有,阿里云开发者社区不拥有其著作权,亦不承担相应法律责任。具体规则请查看《阿里云开发者社区用户服务协议》和《阿里云开发者社区知识产权保护指引》。如果您发现本社区中有涉嫌抄袭的内容,填写侵权投诉表单进行举报,一经查实,本社区将立刻删除涉嫌侵权内容。
"Flink的增量检查点需要(1)很好地扩展到非常大的状态,以及(2)允许从检查点恢复到合理有效,即使在一次运行数周或数月后执行数百万个检查点之后也是如此。特别是,有必要定期合并/合并较旧的检查点,以便最终不会试图从无限制的检查点链恢复到遥远的过去。这就是为什么你会看到一些检查点比其他检查点做更多的工作,即使在恒定负载下。另请注意,在使用少量状态进行测试时,此效果更明显(120 MB与一些Flink用户报告使用的状态相比,小于10 TB)。
为了理解Flink的增量检查点如何更详细地工作,我建议观看来自Flink Forward的Stefan Richter的演讲。"