开发者社区> 问答> 正文

Hadoop MapReduce如何工作?

Hadoop MapReduce如何工作?

展开
收起
问问小秘 2019-11-07 17:08:08 1441 0
2 条回答
写回答
取消 提交回答
  • 主要有几个计算过程: map:数据映射,对数据进行清洗过滤和格式化;map的函数是程序编写; combiner:可选,成为map本地的reduce,对map本地端的数据进行局部聚合;函数自己编写或者直接使用reduce函数; shuffle:这个是mapreduce框架自带,主要负责数据从map分发给reduce任务; reduce:数据聚合。

    2020-03-02 20:32:58
    赞同 展开评论 打赏
  • MapReduce操作分为两个阶段:

    映射阶段 - 在此阶段,输入数据由映射任务分割。地图任务并行运行。这些拆分数据用于分析目的。 减少阶段 - 在此阶段,类似的拆分数据将从整个集合中聚合并显示结果。

    2019-11-07 17:08:24
    赞同 展开评论 打赏
问答排行榜
最热
最新

相关电子书

更多
《构建Hadoop生态批流一体的实时数仓》 立即下载
零基础实现hadoop 迁移 MaxCompute 之 数据 立即下载
CIO 指南:如何在SAP软件架构中使用Hadoop 立即下载