开发者社区> 问答> 正文

倾斜Join优化的目的是什么,它是如何实现的?

倾斜Join优化的目的是什么,它是如何实现的?

展开
收起
不吃核桃 2024-08-19 15:51:01 8 0
1 条回答
写回答
取消 提交回答
  • 倾斜Join优化的目的是让倾斜的Partition由更多的Reducer去处理,从而避免长尾。它是通过在Shuffle Write结束后,AQE框架统计每个Partition的Size,并根据特定规则判断是否存在倾斜,若存在,则把该Partition分裂成多个Split,每个Split跟另外一张表的对应Partition做Join来实现的。
    image.png
    image.png

    2024-08-19 20:15:51
    赞同 展开评论 打赏
问答地址:
问答排行榜
最热
最新

相关电子书

更多
低代码开发师(初级)实战教程 立即下载
冬季实战营第三期:MySQL数据库进阶实战 立即下载
阿里巴巴DevOps 最佳实践手册 立即下载