开发者社区> 问答> 正文

PQ2.0的执行计划是什么?

PQ2.0的执行计划是什么?

展开
收起
xi哈啥哈 2022-04-30 13:54:53 4711 0
来自:阿里技术
2 条回答
写回答
取消 提交回答
  • 虽然仍然只能在t2上做数据分片,但12个worker只需要完成t1 join t2这个操作,在join完成后一般数据量会膨胀,通过Shuffle(Repartition)将更多的中间结果分发到后续的slice中,从而以更高的并行度完成与t3的join 各worker完成局部聚集后,如果分组仍很多,可以基于group by key做一次Shuffle来将数据打散到下一层slice,下一组worker会并行完成较重的聚集操作,以及随后的order by局部排序,最终leader只需要做一次merge sort的汇总

    2022-05-08 11:36:59
    赞同 展开评论 打赏
  • 微信搜索「龙哥手记」,回复关键字:见面礼

    学习

    2022-05-05 08:24:50
    赞同 展开评论 打赏
问答地址:
来源圈子
更多
收录在圈子:
+ 订阅
问答排行榜
最热
最新

相关电子书

更多
低代码开发师(初级)实战教程 立即下载
冬季实战营第三期:MySQL数据库进阶实战 立即下载
阿里巴巴DevOps 最佳实践手册 立即下载