备案控制台

开发者社区问答正文

将Map端产生的输出文件拷贝到Reduce端后，每个Reducer如何知道自己应该处理哪些数据呢？

将Map端产生的输出文件拷贝到Reduce端后，每个Reducer如何知道自己应该处理哪些数据呢？

展开

收起

游客ysk6odvtzspxs 2021-12-05 21:01:14 1144 版权

版权声明：本文内容由阿里云实名注册用户自发贡献，版权归原作者所有，阿里云开发者社区不拥有其著作权，亦不承担相应法律责任。具体规则请查看《阿里云开发者社区用户服务协议》和《阿里云开发者社区知识产权保护指引》。如果您发现本社区中有涉嫌抄袭的内容，填写侵权投诉表单进行举报，一经查实，本社区将立刻删除涉嫌侵权内容。

1 条回答

写回答

取消提交回答

游客fdypabnykn7yk

因为Map端进行partition的时候，实际上就相当于指定了每个Reducer要处理的数据(partition就对应了Reducer)，所以Reducer在拷贝数据的时候只需拷贝与自己对应的partition中的数据即可。每个Reducer会处理一个或者多个partition，但需要先将自己对应的partition中的数据从每个Map的输出结果中拷贝过来。

2021-12-05 21:01:54

赞同展开评论

问答标签：

Map reduce Map数据 Map reduce数据

问答地址：

开发者社区 > 云计算 > 问答

相关问答

Flink CDC map reduce是什么意思啊？

178

1

0

请问一下，flink有办法让上游数据均匀分配到下游的map算子么，试了下shuffle和rebal？

282

3

0

在大数据计算MaxCompute中内存是map和reduce或者join阶段的内存吗？

98

0

0

datawork api看文档返回的是个map，如果我一次性要查很多条数据，该怎么用？

212

12

0

flink cdc 写代码的方式接收数据-map操作-sink到表是导入那个Maven依赖啊？

120

0

0

在大数据计算MaxCompute是如何设置map和reduce个数的？

134

1

0

为什么nacos-当配置存在map类型，移除元素无效，保留的还是原来的数据怎么办？

229

0

0

大数据计算MaxCompute跑数据 44分钟跑了 41% 的map ，有没有好的建议啊？

92

0

0

MaxCompute中Json格式映射Map格式数据

117

1

0

flinkcdc中Mongo列数据为Object类型，用Map<STRING,STRING>行吗？

109

1

0

问答排行榜

最热

最新

【大咖问答】对话PostgreSQL 中国社区发起人之一，阿里云数据库高级专家德哥

据说在家办公的程序员是这样写代码的？

如何升级配置

【藏经阁一起读（27）】本周推荐《Apache Flink案例集（2022版）》，你有哪些心得？

【精品问答】python技术1000问(1)

PolarDB这个PXD部署这个端口可以指定吗？

通义灵码启动异常，可点击按钮进行一键修复，如仍无法解决，请参考[问题排查指南](https://he

关于idea lingma欺骗的对话。请开发者尽快修复

怎么搭建本地文生图工作流

通义灵码提示看起来我们今天已经有了很多的对话，我很感谢你的热情，但我现在需要稍微休息一下。提前抱

还有其他疑问?