备案控制台

开发者社区问答正文

mapreduce 的大致流程

mapreduce 的大致流程

展开

收起

愚笨如你 2020-02-14 20:01:21 858 版权

版权声明：本文内容由阿里云实名注册用户自发贡献，版权归原作者所有，阿里云开发者社区不拥有其著作权，亦不承担相应法律责任。具体规则请查看《阿里云开发者社区用户服务协议》和《阿里云开发者社区知识产权保护指引》。如果您发现本社区中有涉嫌抄袭的内容，填写侵权投诉表单进行举报，一经查实，本社区将立刻删除涉嫌侵权内容。

1 条回答

写回答

取消提交回答

愚笨如你

主要分为八个步骤

对文件进行切片，提前想好块的大小如何分配启动相应数量的 maptask 进程调用 FileInputFormat 中的 RecordReader，读一行数据并封装为 k1v1 调用自定义的 map 函数，并将 k1v1 传给 map，一个任务对应一个 map 收集 map 的输出，进行分区和排序，这块要注意优化。 reduce task 任务启动，并从 map 端拉取数据 reduce task 调用自定义的 reduce 函数进行处理调用 outputformat 的 recordwriter 将结果数据输出

2020-02-14 20:01:37

赞同展开评论

问答分类：

分布式计算

问答标签：

mapreduce流程开源大数据平台 E-MapReduce流程开源大数据平台 E-MapReduce大致流程

问答地址：

开发者社区 > 大数据 > 问答

相关问答

E-MapReduce弹性伸缩配置本地盘机型扩容流程报错问题

87

0

0

E-MapReduce EMR集群JindoSDK升级流程

97

1

0

E-MapReduce EMR集群JindoData升级流程

92

1

0

E-MapReduce ECS自身问题导致弹性伸缩流程卡住

112

1

0

MapReduce的工作流程是怎样的呢？

622

1

0

mapReduce中shuffle阶段的工作流程是什么，如何优化shuffle阶段呢？

396

1

0

mapreduce的大致流程是什么？

320

1

0

阿里云E-MapReduce调度资源组绑集群，选不到集群，怎么办呢？

152

1

0

E-MapReduce集群impala开启kerberos后服务报错Couldn't find...

117

1

0

E-MapReduce集群的Flink指标详解

109

1

0

问答排行榜

最热

最新

【大咖问答】对话PostgreSQL 中国社区发起人之一，阿里云数据库高级专家德哥

据说在家办公的程序员是这样写代码的？

如何升级配置

【藏经阁一起读（27）】本周推荐《Apache Flink案例集（2022版）》，你有哪些心得？

【精品问答】python技术1000问(1)

PolarDB这个PXD部署这个端口可以指定吗？

通义灵码启动异常，可点击按钮进行一键修复，如仍无法解决，请参考[问题排查指南](https://he

关于idea lingma欺骗的对话。请开发者尽快修复

怎么搭建本地文生图工作流

通义灵码提示看起来我们今天已经有了很多的对话，我很感谢你的热情，但我现在需要稍微休息一下。提前抱

相关文章

只靠国产算力与开源数据，端侧模型预训练行不行？我们做到了全流程开源

MaxCompute SQL AI 超轻体验

MaxCompute SQL AI 超轻体验：

告别代码焦虑：MaxCompute SQL AI 让你的数据“开口说话”

云上数据管道太烧钱？别急，我给你捋一捋这三刀该怎么省（存储 / 计算 / 网络）

还有其他疑问?