开发者社区 问答 正文

将Map端产生的输出文件拷贝到Reduce端后,每个Reducer如何知道自己应该处理哪些数据呢?

将Map端产生的输出文件拷贝到Reduce端后,每个Reducer如何知道自己应该处理哪些数据呢?

展开
收起
游客ysk6odvtzspxs 2021-12-05 21:01:14 1098 分享 版权
1 条回答
写回答
取消 提交回答
  • 因为Map端进行partition的时候,实际上就相当于指定了每个Reducer要处理的数据(partition就对应了Reducer),所以Reducer在拷贝数据的时候只需拷贝与自己对应的partition中的数据即可。每个Reducer会处理一个或者多个partition,但需要先将自己对应的partition中的数据从每个Map的输出结果中拷贝过来。

    2021-12-05 21:01:54
    赞同 展开评论