文档备案控制台

开发者社区问答正文

Mapreduce和Spark的区别是什么？

Mapreduce和Spark的区别是什么？

展开

收起

芯在这 2021-12-06 23:38:58 276 版权

版权声明：本文内容由阿里云实名注册用户自发贡献，版权归原作者所有，阿里云开发者社区不拥有其著作权，亦不承担相应法律责任。具体规则请查看《阿里云开发者社区用户服务协议》和《阿里云开发者社区知识产权保护指引》。如果您发现本社区中有涉嫌抄袭的内容，填写侵权投诉表单进行举报，一经查实，本社区将立刻删除涉嫌侵权内容。

1 条回答

写回答

取消提交回答

真的很搞笑

hadoop的一个作业：job job分为map task和reduce task，每个task都是在自己的进程中运行的当task结束时，进程也会结束

spark用户提交的任务：application 一个application对应一个sparkcontext，app中存在多个job 每触发一次action操作就会产生一个job 这些job可以并行或串行执行每个job中有多个stage，stage是shuffle过程中DAGSchaduler通过RDD之间的依赖关系划分job而来的每个stage里面有多个task，组成taskset有TaskSchaduler分发到各个executor中执行 executor的生命周期是和app一样的，即使没有job运行也是存在的，所以task可以快速启动读取内存进行计算。

hadoop的job只有map和reduce操作，表达能力比较欠缺在mr过程中会重复的读写hdfs，造成大量的io操作，多个job需要自己管理关系。

spark的迭代计算都是在内存中进行的 API中提供了大量的RDD操作如join，groupby等通过DAG图可以实现良好的容错

2021-12-06 23:39:40

赞同展开评论

问答分类：

分布式计算 Spark

问答标签：

apache spark Mapreduce mapreduce区别 mapreduce spark mapreduce apache spark 开源大数据平台 E-MapReduce spark

问答地址：

开发者社区 > 大数据 > 问答

相关问答

serverless spark 和 emr on ack中spark集群类型区别是什么？

167

1

0

阿里云E-MapReduce如何讓 spark 任務的 dataframe可以出現在日志之內?

331

0

0

Spark相比MapReduce在编程友好性上有哪些优势？

135

1

0

E-MapReduce 、 Dataworks 的区别是什么？

185

1

0

E-MapReduce Serverless Spark 版开发是使用dataworks的吗？

141

0

0

阿里云E-MapReduce在 SPARK 任務在不知道 EMR master ip addres

441

2

0

E-MapReduce集群使用notebook连接spark-sql报错The request...

147

1

0

E-MapReduce集群的Flink指标详解

132

1

0

如何修改E-MapReduce集群的root用户的登录密码

128

1

0

E-MapReduce集群StarRocks执行SQL报错:Execute again aft...

192

1

0

问答排行榜

最热

最新

【大咖问答】对话PostgreSQL 中国社区发起人之一，阿里云数据库高级专家德哥

据说在家办公的程序员是这样写代码的？

如何升级配置

【藏经阁一起读（27）】本周推荐《Apache Flink案例集（2022版）》，你有哪些心得？

【精品问答】python技术1000问(1)

OpenClaw Gateway Token 获取？

阿里云千问Token价格怎么收费？

内存被通义灵码吃光了。我电脑总共48G的内存，被通义灵码吃掉了30几G，你们搞什么飞机？

我下载的gguf文件，最新的LMSTUDIO仍然无法识别什么问题

CoPAW配置后，对话，出现 AGENT_UNKNOWN_ERROR 如何解决

相关文章

Dataphin功能Tips系列（92）如何方便快速地通过SQL取数实现定制化数据同步

阿里云第九代ECS云服务器（c9i、g9i、r9i）CPU采用Intel® Xeon® Granite Rapids处理器，主频3.2 GHz

别再盲目上 Serverless 了：聊聊 Serverless 数据分析的真相、成本和适用场景

企业如何用IP地址进行风控管理？一套实操方案

别把数据中台做成“数据坟场”：聊聊企业数据中台架构的真实落地之路

还有其他疑问?