MapReduce 编程模型将一个大的计算问题分解成多个小的计算问题,由多个 map() 函数对这些分解后的小问题进行并行计算,输出中间计算结果,然后由 reduce() 函数对 map()函数的输出结果进行进一步合并,得出最终的计算结果。
如下图所示,Map 阶段将一个复杂的任务分解为多个简单的小任务,这些小任务会在多个 map() 函数中进行并行处理,然后每个 map() 函数将处理的中间结果输出。Reduce 阶段将对这些中间结果根据键做聚合处理,最终输出聚合后的结果数据。下面用 Java 伪代码描述 Map 阶段和 Reduce 阶段。
以上内容摘自《海量数据处理与大数据技术实战》电子书,点击https://developer.aliyun.com/topic/download?id=8205可下载完整版
版权声明:本文内容由阿里云实名注册用户自发贡献,版权归原作者所有,阿里云开发者社区不拥有其著作权,亦不承担相应法律责任。具体规则请查看《阿里云开发者社区用户服务协议》和《阿里云开发者社区知识产权保护指引》。如果您发现本社区中有涉嫌抄袭的内容,填写侵权投诉表单进行举报,一经查实,本社区将立刻删除涉嫌侵权内容。