开发者社区 问答 正文

hadoop 排序算法是什么算法

hadoop 排序算法是什么算法

展开
收起
知与谁同 2018-07-16 17:50:32 1821 分享 版权
1 条回答
写回答
取消 提交回答
  • 为了提高reduce阶段的并行度,TeraSort作业对以上算法进行改进:在map阶段,每个map task都会将数据划分成R个数据块(R为reduce task个数)
    其中第i(i>0)个数据块的所有数据都会比第i+1个中的数据大;
    在reduce阶段,第i个reduce task处理(进行排序)所有map task的第i块,这样第i个reduce task产生的结果均会比第i+1个大,最后将1~R个reduce task的排序结果顺序输出,即为最终的排序结果。
    2019-07-17 22:49:50
    赞同 展开评论