开发者社区 问答 正文

Hudi的checkpoint一致性问题是什么,你们是如何解决的?

Hudi的checkpoint一致性问题是什么,你们是如何解决的?

展开
收起
迪哒迪滴喵 2024-08-13 19:08:37 60 分享 版权
1 条回答
写回答
取消 提交回答
  • Hudi的checkpoint一致性问题在于,checkpoint完成后的commit操作可能因为notification回调操作未成功执行而导致数据丢失。具体流程是,writer算子在checkpoint时flush内存数据,并给writer coordinator汇报信息,但notification回调并不在checkpoint生命周期内,可能导致commit操作丢失。我们通过与Hudi社区的合作,确保了checkpoint完成后,如果notification未成功,则不进行commit操作,从而避免了数据丢失的问题。image.png

    2024-08-13 21:50:54
    赞同 2 展开评论
问答地址: