开发者社区> 问答> 正文

案例学习:MapReduce

案例学习:MapReduce

展开
收起
kun坤 2020-04-23 16:39:59 344 0
1 条回答
写回答
取消 提交回答
  • MapReduce可以说是开启了分布式系统在工业界的普遍应用。

    MapReduce的诞生是为了解决希望在短时间内分析和处理几TB级别的数据。譬如:构建索引、排序、分析爬虫回来文档的Web结构

    目标:即使是非分布式专家也能很轻松的写分布式程序。工程师只需要定义Map和reduce即可.Map 和reduce的执行由分布式框架处理。

    MapReduce任务执行抽象: 0082zybpgy1gc9jyqy1pbj30g209ht95.jpg

    1. MR调用输入文件的map()任务,产生新的数据集合(k2,v2) —中间数据
    2. MR根据提供的K2对数据v2进行规整
    3. 把key和value传递给reduce处理
    4. 最终根据一系列的(k2,v2)集合生成最终结果
    2020-04-23 16:40:51
    赞同 展开评论 打赏
问答排行榜
最热
最新

相关电子书

更多
HBase 基本知识介绍及典型案例分析 立即下载
HBase 基本知识介绍及典型案例分析 立即下载
HBase基本知识介绍及典型案例分析 立即下载

相关实验场景

更多