开发者社区> 问答> 正文

MapReduce中的Merge的作用是什么?

MapReduce中的Merge的作用是什么?

展开
收起
游客daliwbfb2wo66 2021-12-04 22:02:38 537 0
1 条回答
写回答
取消 提交回答
  • 每次溢写会在磁盘上产生一个溢写文件,Map 输出结果很大时,会有多次这样的溢写文件到磁盘上,当 Map task 结束完成时,内存缓冲区的数据同样也会溢写到磁盘上,结果磁盘会有一个或多个溢出的文件,同时合并溢出的文件。(如果map输出的结果很少,map完成时,溢出的文件只有一个)合并这个过程就叫做Merge。

    merge是将多个溢写文件合并到一个文件,所以可能也有相同的key存在,在这个过程中如果client设置过Combiner,也会使用Combiner来合并相同的key。

    2021-12-04 22:02:58
    赞同 展开评论 打赏
问答分类:
问答地址:
问答排行榜
最热
最新

相关电子书

更多
Apache Flink 流式应用中状态的数据结构定义升级 立即下载
LEARNINGS USING SPARK STREAMING & DATAFRAMES FOR WALMART SEARCH 立即下载
【Flink Day - 02 - 五藏】Flink_Model_and_Modules 立即下载