开发者社区 问答 正文

编写MapReduce作业时,如何做到在Reduce阶段,先对key排序,再对value排序?

编写MapReduce作业时,如何做到在Reduce阶段,先对key排序,再对value排序?

展开
收起
芯在这 2021-12-05 21:50:57 396 分享 版权
1 条回答
写回答
取消 提交回答
  • 该问题通常称为“二次排序”,最常用的方法是将value放到key中,实现一个组合Key,然后自定义key排序规则(为key实现一个WritableComparable)。

    2021-12-05 21:51:08
    赞同 展开评论