开发者社区> 问答> 正文

MapReduce中MapTask工作机制中的Spill阶段的工作是什么?

MapReduce中MapTask工作机制中的Spill阶段的工作是什么?

展开
收起
游客daliwbfb2wo66 2021-12-04 20:39:28 452 0
1 条回答
写回答
取消 提交回答
  • Spill阶段:即“溢写”,当环形缓冲区满后,MapReduce会将数据写到本地磁盘上,生成一个临时文件。需要注意的是,将数据写入本地磁盘之前,先要对数据进行一次本地排序,并在必要时对数据进行合并、压缩等操作。

    2021-12-04 20:39:40
    赞同 展开评论 打赏
问答排行榜
最热
最新

相关电子书

更多
Flink中的两类新型状态存储 立即下载
HareQL:快速HBase查询工具的发展过程 立即下载
Apache Flink 流式应用中状态的数据结构定义升级 立即下载