备案控制台

开发者社区> 问答> 正文

hadoop和spark的shuffle过程是什么？

hadoop和spark的shuffle过程是什么？

展开

收起

芯在这 2021-12-06 23:42:07 335 0

1 条回答

写回答

取消提交回答

真的很搞笑

hadoop：map端保存分片数据，通过网络收集到reduce端

spark：spark的shuffle是在DAGSchedular划分Stage的时候产生的，TaskSchedule要分发Stage到各个worker的executor，减少shuffle可以提高性能

2021-12-07 08:08:08

赞同展开评论打赏

问答分类：

分布式计算 Hadoop Spark

问答标签：

hadoop spark apache spark Hadoop hadoop apache spark apache spark shuffle hadoop shuffle

问答地址：

开发者社区 > 大数据 > 问答

版权声明：本文内容由阿里云实名注册用户自发贡献，版权归原作者所有，阿里云开发者社区不拥有其著作权，亦不承担相应法律责任。具体规则请查看《阿里云开发者社区用户服务协议》和《阿里云开发者社区知识产权保护指引》。如果您发现本社区中有涉嫌抄袭的内容，填写侵权投诉表单进行举报，一经查实，本社区将立刻删除涉嫌侵权内容。

相关问答

MaxCompute spark*.*.* hadoop-common用的是哪个版本

13

1

0

MaxCompute spark作业报错Class org.apache.hadoop.fs....

18

1

0

Flink CDC有信创要求的，能用hadoop flink spark 这些开源组件吗？

245

3

0

你觉得Hadoop和Spark的技术优缺点以及适用场景都有哪些？

683

1

0

spark on k8s，有使用without-hadoop版本的吗？

769

0

0

大数据系统（Hadoop/Spark）特点是什么？

559

1

0

spark 执行RDD操作的过程要注意什么吗？

2321

1

0

Storm&Spark中Hadoop包括什么呢？

653

1

0

对spark2.4来说Hadoop的最佳版本是？

1377

1

0

对spark2.4来说Hadoop的最佳版本

5550

1

0

问答排行榜

最热

最新

1 通过阿里云代备案系统进行个人快速备案 2699917

2 【大咖问答】对话PostgreSQL 中国社区发起人之一，阿里云数据库高级专家德哥 1818327

3 据说在家办公的程序员是这样写代码的？ 1792367

4 阿里云开放端口权限 689932

5 如何升级配置 536076

6 【藏经阁一起读（27）】本周推荐《Apache Flink案例集（2022版）》，你有哪些心得？ 522472

7 【精品问答】python技术1000问(1) 514007

8 Flink Forward Asia 2021 有奖问答 512809

9 Linux Bash严重漏洞修复紧急通知（已全部给出最终修复方案） 456923

10 OceanBase 使用动画（持续更新） 359270

11 阿里云LNAMP(Linux + Nginx + Apache + MySQL + PHP)环境一键安装脚本 329725

12 OSS存储服务-客户端工具 321348

13 为体验实验室取一个新名字。 307329

14 企业邮箱发送邮件时，若出现投递失败产生退信，内容提示包含如下： the mta server of * reply:550 failed to meet SPF requirements 或者 the mta server of 163.com — 163mx01.mxmail.netease.com(220.181.14.141) reply:550 MI:SPF mx14,QMCowECpA0qTiftVaeB3Cg—.872S2 1442548128 http://mail.163.com/help 303869

15 Win Server 2003-2016 加密勒索事件必打补丁合集 295171

16 FLASH播放器，在IE浏览器下显示请确定您的域名已完成备案和CNAME绑定 283669

17 安全组详解，新手必看教程 277263

18 写code还是做管理，开发者如何进行职业规划？ 268486

19 惊喜翻倍：免费ECS+免费环境配置~！(ECS免费体验6个月活动3月31日结束) 255832

20 阿里云手机和阿云浏览器连接问题专帖 235632

1 使用通义灵码冲刺备战求职季，你有哪些深刻体验？ 117

2 通用大模型VS垂直大模型，你倾向于哪一方？ 181

3 如何破除工作中的“路径依赖”？ 163

4 一键生成你眼中的未来城市，分享部署过程、输出结果及使用体验 685

5 展示你用AI工具生成动漫头像，并分享配置过程及使用体验 440

6 国内AI大模型高考数学成绩超GPT-4o，如何看待这一结果？ 722

7 如何避免“写代码5分钟，调试2小时”的尴尬？ 805

8 通义灵码生成Git Commit的时候，偶尔生成中文，偶尔生成英文，根本无法控制生成的语言。 214

9 一键部署3D卡通风格模型，分享部署过程及使用体验 622

10 展示你通过AI修饰的自然风光照片，并讲述你的拍摄和编辑过程 1083

11 机器学习PAI现在一直在重试，怎样停掉？ 252

12 请问机器学习PAI eas服务拉取dockerhub失败怎么办？ 202

13 机器学习PAI dlc一直卡在预分配怎么解决？没有日志吗？ 119

14 请教下机器学习PAI的代码配置没有链接测试吗？ 140

15 平头哥芯片W800:芯片如何购买？ 179

16 阿里云Grafana升级10后已有的飞书webhook 报警机器人不再工作。请问如何排查？ 169

17 请问通义灵码IDEA生成Git Commit Message 如何默认生成中文注释 142

18 登录nacos提示No message available 怎么办？ 118

19 Nacos登录密码忘记了如何修改？ 484

20 你知道APP是怎么开发的吗？ 1750

相关课程

更多

大数据实战项目：反爬虫系统（Lua+Spark+Redis+Hadoop框架搭建）第一阶段

382

33

去学习

大数据实战项目：反爬虫系统（Lua+Spark+Redis+Hadoop框架搭建）第四阶段

120

19

去学习

大数据实战项目：反爬虫系统（Lua+Spark+Redis+Hadoop框架搭建）第五阶段

146

32

去学习

大数据Hadoop快速入门

3818

18

去学习

Hadoop快速入门

3506

39

去学习

Hadoop企业优化及扩展案例

399

7

去学习

推荐问答

乘风问答官招募中！机械键盘免费拿

相关电子书

更多

《构建Hadoop生态批流一体的实时数仓》 立即下载

零基础实现hadoop 迁移 MaxCompute 之数据 立即下载

CIO 指南:如何在SAP软件架构中使用Hadoop 立即下载