开发者社区 问答 正文

MapReduce中的Shuffle是什么?

MapReduce中的Shuffle是什么?

展开
收起
游客daliwbfb2wo66 2021-12-04 21:54:20 315 分享
分享
版权
举报
1 条回答
写回答
取消 提交回答
  • 每个map task都有一个内存缓冲区,存储着map的输出结果,当缓冲区快满的时候需要将缓冲区的数据以一个临时文件的方式存放到磁盘,当整个map task结束后再对磁盘中这个map task产生的所有临时文件做合并,生成最终的正式输出文件,然后等待reduce task来拉数据。

    2021-12-04 21:54:38 举报
    赞同 评论

    评论

    全部评论 (0)

    登录后可评论
AI助理

你好,我是AI助理

可以解答问题、推荐解决方案等