开发者社区> 问答> 正文

MapReduce基本处理过程是什么?

MapReduce基本处理过程是什么?

展开
收起
芯在这 2021-12-07 11:43:07 231 0
1 条回答
写回答
取消 提交回答
  • 从HDFS文件系统读取数据集

    将数据集拆分成小块并分配给所有可用节点

    针对每个节点上的数据子集进行计算(计算的中间态结果会重新写入HDFS)

    重新分配中间态结果并按照键进行分组

    通过对每个节点计算的结果进行汇总和组合对每个键的值进行“Reducing”

    将计算而来的最终结果重新写入 HDFS

    2021-12-07 11:43:20
    赞同 展开评论 打赏
问答分类:
问答地址:
问答排行榜
最热
最新

相关电子书

更多
Apache Flink 流式应用中状态的数据结构定义升级 立即下载
为流处理世界重新设计的存储 立即下载
使用Apache Beam和HBase进行高效数据处理 立即下载