开发者社区 问答 正文

倾斜Join优化的目的是什么,它是如何实现的?

倾斜Join优化的目的是什么,它是如何实现的?

展开
收起
不吃核桃 2024-08-19 15:51:01 42 分享 版权
1 条回答
写回答
取消 提交回答
  • 倾斜Join优化的目的是让倾斜的Partition由更多的Reducer去处理,从而避免长尾。它是通过在Shuffle Write结束后,AQE框架统计每个Partition的Size,并根据特定规则判断是否存在倾斜,若存在,则把该Partition分裂成多个Split,每个Split跟另外一张表的对应Partition做Join来实现的。
    image.png
    image.png

    2024-08-19 20:15:51
    赞同 展开评论
问答地址: