开发者社区> 问答> 正文

Hudi表的冷启动问题具体是什么,你们是如何解决的?

Hudi表的冷启动问题具体是什么,你们是如何解决的?

展开
收起
迪哒迪滴喵 2024-08-13 19:06:36 43 0
1 条回答
写回答
取消 提交回答
  • Hudi表的冷启动问题是指,当一张已存在的Hudi表需要通过Flink进行增量化更新写入时,需要将Hudi表已有的信息写入到Flink state里。原始方案性能低下,因为每个BucketAssigner都要读取全表数据。我们与Hudi社区沟通后,引入了Bootstrap机制,由coordinator和IndexBootstrap两个算子组成,专门负责冷启动过程。Indeximage.png
    Bootstrap负责读取数据,coordinator负责协调分配,确保数据只被读取一次且多并发读取,大大提高了效率。

    2024-08-13 21:49:23
    赞同 1 展开评论 打赏
问答地址:
问答排行榜
最热
最新

相关电子书

更多
低代码开发师(初级)实战教程 立即下载
冬季实战营第三期:MySQL数据库进阶实战 立即下载
阿里巴巴DevOps 最佳实践手册 立即下载