分布式计算引擎MapReduce
应用场景
当数据量大到一定程度,传统的技术无法进行解决的时候,那么需要采用分布式计算引擎MapReduce来尝试解决了!
操作步骤
1. 架构图
Hadoop是由Apache基金会所开发的分布式系统基础架构,组织架构如下图所示:
正如上图所示:Hadoop包含很多优秀的子项目,例如HDFS,Mapreduce,Hbase,Hive,Zookeeper等,其中最重要的,也是Hadoop当时风靡一时的原因是HDFS(分布式文件系统)和Mapreduce(分布式计算框架)。