开发者社区> 问答> 正文

你们是如何解决Hudi与Flink的checkpoint一致性问题的?

你们是如何解决Hudi与Flink的checkpoint一致性问题的?

展开
收起
迪哒迪滴喵 2024-08-13 19:08:37 47 0
1 条回答
写回答
取消 提交回答
  • 为了解决Hudi与Flink的checkpoint一致性问题,我们对任务进行了重构。Writer算子在checkpoint时,会将汇报给writer coordinator的信息进行state持久化。任务重启后,这些信息会重新汇报给writer coordinator算子。writer coordinator算子收集所有writer算子的信息,并进行一次commit判断,确保对应的commit已经完成。同时,Writer算子会保持阻塞状态,直到上次持久化的commit完成image.png
    后,才会处理最新的数据。这样,我们就对齐了Hudi与Flink的checkpoint机制,保证了边界场景数据的一致性。

    2024-08-13 21:50:55
    赞同 展开评论 打赏
问答排行榜
最热
最新

相关电子书

更多
Flink CDC Meetup PPT - 龚中强 立即下载
Flink CDC Meetup PPT - 王赫 立即下载
Flink CDC Meetup PPT - 覃立辉 立即下载