开发者社区> 问答> 正文

请简述 mapreduce 中的 combine 和 partition 的作用

请简述 mapreduce 中的 combine 和 partition 的作用

展开
收起
愚笨如你 2020-02-14 19:45:35 2266 0
1 条回答
写回答
取消 提交回答
  • combiner 是发生在 map 的最后一个阶段,其原理也是一个小型的 reducer,主要作用是减少输出到 reduce 的数据量,提高网络传输瓶颈,提高 reducer 的执行效率。 partition 的主要作用将 map 阶段产生的所有 k,v 对分配给不同的 reducer task 处理,可以将 reduce 阶段的处理负载进行分摊。

    2020-02-14 19:45:51
    赞同 展开评论 打赏
问答排行榜
最热
最新

相关电子书

更多
LEARNINGS USING SPARK STREAMING & DATAFRAMES FOR WALMART SEARCH 立即下载
Apache Flink 流式应用中状态的数据结构定义升级 立即下载
Get rid of traditional ETL, Move to Spark! 立即下载