开发者社区 问答 正文

MapReduce中MapTask工作机制中的Spill阶段的工作是什么?

MapReduce中MapTask工作机制中的Spill阶段的工作是什么?

展开
收起
游客daliwbfb2wo66 2021-12-04 20:39:28 543 分享 版权
1 条回答
写回答
取消 提交回答
  • Spill阶段:即“溢写”,当环形缓冲区满后,MapReduce会将数据写到本地磁盘上,生成一个临时文件。需要注意的是,将数据写入本地磁盘之前,先要对数据进行一次本地排序,并在必要时对数据进行合并、压缩等操作。

    2021-12-04 20:39:40
    赞同 展开评论