开发者社区 问答 正文

在Hudi的Append写入场景下,你们进行了哪些优化来提升吞吐能力?

在Hudi的Append写入场景下,你们进行了哪些优化来提升吞吐能力?

展开
收起
迪哒迪滴喵 2024-08-13 19:08:38 63 分享 版权
1 条回答
写回答
取消 提交回答
  • image.png
    在Hudi的Append写入场景下,我们进行了以下优化来提升吞吐能力:
    1.优化了小文件的查找过程。由于Append场景不存在文件大小不均匀的问题,我们简化了update模式下每次checkpoint后重新list文件并查找小文件的操作。
    2.替换了keyby操作。在Append场景下,由于没有重复key,我们使用chain代替keyby,减少了节点之间序列化传输的开销。
    3.避免了内存合并。Append场景下不存在内存合并的需求,整体效率更高。

    2024-08-13 21:50:54
    赞同 展开评论
问答地址: