开发者社区> 问答> 正文

不需要排序的hash shuffle一定比需要排序的sort shuffle速度快吗?

不需要排序的hash shuffle一定比需要排序的sort shuffle速度快吗?

展开
收起
芯在这 2021-12-06 00:46:49 375 0
1 条回答
写回答
取消 提交回答
  • 不一定!!当数据规模小,Hash shuffle快于Sorted Shuffle数据规模大的时候;当数据量大,sorted Shuffle会比Hash shuffle快很多,因为数量大的有很多小文件,不均匀,甚至出现数据倾斜,消耗内存大,1.x之前spark使用hash,适合处理中小规模,1.x之后,增加了Sorted shuffle,Spark更能胜任大规模处理了。

    2021-12-06 00:47:00
    赞同 展开评论 打赏
问答地址:
问答排行榜
最热
最新

相关电子书

更多
低代码开发师(初级)实战教程 立即下载
冬季实战营第三期:MySQL数据库进阶实战 立即下载
阿里巴巴DevOps 最佳实践手册 立即下载