开发者社区> 问答> 正文

在Hudi的Append写入场景下,你们进行了哪些优化来提升吞吐能力?

在Hudi的Append写入场景下,你们进行了哪些优化来提升吞吐能力?

展开
收起
迪哒迪滴喵 2024-08-13 19:08:38 24 0
1 条回答
写回答
取消 提交回答
  • image.png
    在Hudi的Append写入场景下,我们进行了以下优化来提升吞吐能力:
    1.优化了小文件的查找过程。由于Append场景不存在文件大小不均匀的问题,我们简化了update模式下每次checkpoint后重新list文件并查找小文件的操作。
    2.替换了keyby操作。在Append场景下,由于没有重复key,我们使用chain代替keyby,减少了节点之间序列化传输的开销。
    3.避免了内存合并。Append场景下不存在内存合并的需求,整体效率更高。

    2024-08-13 21:50:54
    赞同 展开评论 打赏
问答地址:
问答排行榜
最热
最新

相关电子书

更多
低代码开发师(初级)实战教程 立即下载
冬季实战营第三期:MySQL数据库进阶实战 立即下载
阿里巴巴DevOps 最佳实践手册 立即下载