问题一:为什么更倾向于使用 Retained Checkpoint 而不是 Savepoint 来重启作业?
为什么更倾向于使用 Retained Checkpoint 而不是 Savepoint 来重启作业?
参考回答:
我们更倾向于使用 Retained Checkpoint 来重启作业,因为使用 RocksDBStateBackend 的增量 Checkpoint 相对于 Savepoint,其制作和恢复效率更高,间隔配置更短,从状态恢复时需要回溯的数据也更少。
关于本问题的更多回答可点击原文查看:
https://developer.aliyun.com/ask/671829
问题二:Checkpoint 跨机房副本的目标是什么?
Checkpoint 跨机房副本的目标是什么?
参考回答:
Checkpoint 跨机房副本的目标主要有两个:一是支持所有作业换机房从 Checkpoint 启动,需要在作业换机房启动前将原机房的 Checkpoint 复制到目标机房;二是支持关键作业的 Checkpoint 跨机房容灾,实时将新产生的 Checkpoint 复制到备份机房,以防止原机房突然故障。
关于本问题的更多回答可点击原文查看:
https://developer.aliyun.com/ask/671830
问题三:为什么需要改造 Flink 引擎使 Checkpoint 满足 self-contained & relocatable 的条件?
为什么需要改造 Flink 引擎使 Checkpoint 满足 self-contained & relocatable 的条件?
参考回答:
需要改造 Flink 引擎使 Checkpoint 满足 self-contained & relocatable 的条件,是因为只有满足这个条件,Checkpoint 的副本才是可用的,才能确保 Checkpoint 复制到其他地方后能够成功恢复作业。
关于本问题的更多回答可点击原文查看:
https://developer.aliyun.com/ask/671831
问题四:Checkpoint 目录结构中的 exclusive 目录、shared 目录和 taskowned 目录分别用于存放什么?
Checkpoint 目录结构中的 exclusive 目录、shared 目录和 taskowned 目录分别用于存放什么?
参考回答:
在 Checkpoint 目录结构中,exclusive 目录用于存放每个 Checkpoint 的独有的文件;shared 目录用于存放各个 Checkpoint 之间会共享的文件;taskowned 目录用于存放永远不能由 JobManager(JM)删除的文件。
关于本问题的更多回答可点击原文查看:
https://developer.aliyun.com/ask/671833
问题五:Checkpoint 的 metadata 文件包含哪些信息?
Checkpoint 的 metadata 文件包含哪些信息?
参考回答:
Checkpoint 的 metadata 文件保存了 Checkpoint 的元数据,这些元数据对于恢复作业至关重要,但具体包含哪些信息需要根据 Flink 的具体实现来确定。
关于本问题的更多回答可点击原文查看: