开发者社区 问答 正文

请简述 mapreduce 中的 combine 和 partition 的作用

请简述 mapreduce 中的 combine 和 partition 的作用

展开
收起
愚笨如你 2020-02-14 19:45:35 2370 分享 版权
1 条回答
写回答
取消 提交回答
  • combiner 是发生在 map 的最后一个阶段,其原理也是一个小型的 reducer,主要作用是减少输出到 reduce 的数据量,提高网络传输瓶颈,提高 reducer 的执行效率。 partition 的主要作用将 map 阶段产生的所有 k,v 对分配给不同的 reducer task 处理,可以将 reduce 阶段的处理负载进行分摊。

    2020-02-14 19:45:51
    赞同 展开评论