分布式计算框架-MapReduce
MapReduce是分散->汇总模式的分布式计算框架,可供开发人员开发相关程序进行分布式数据计算
MapReduce提供了2个编程接口
Map
Reduce
其中
Map功能接口提供了“分散”的功能,由服务器分布式对数据进行处理
Reduce功能接口提供了“汇总(聚合)”的功能,将分布式的处理结果汇总统计
用户如需使用MapReducue框架完成自定义需求的程序开发
只需要使用java,python等编程语言,实现Map Reduce功能接口即可
MapReduce的运行机制
将要执行的需求,分解为多个Map Task和Reduce Tack (Tack任务的意思)
将Map Task 和 Reduce分配到对应的服务器去执行