文档备案控制台

开发者社区大数据文章正文

六、【计算】大数据Shuffle原理与实践（下） | 青训营笔记

2023-02-09 386

版权

版权声明：

本文内容由阿里云实名注册用户自发贡献，版权归原作者所有，阿里云开发者社区不拥有其著作权，亦不承担相应法律责任。具体规则请查看《阿里云开发者社区用户服务协议》和《阿里云开发者社区知识产权保护指引》。如果您发现本社区中有涉嫌抄袭的内容，填写侵权投诉表单进行举报，一经查实，本社区将立刻删除涉嫌侵权内容。

简介： 六、【计算】大数据Shuffle原理与实践（下） | 青训营笔记

👉引言💎

学习的最大理由是想摆脱平庸，早一天就多一份人生的精彩；迟一天就多一天平庸的困扰。热爱写作，愿意让自己成为更好的人............

	铭记于心
	🎉✨🎉我唯一知道的，便是我一无所知🎉✨🎉

四、Push Shuffle

0 概述

为什么需要Push Shuffle，因为一般shuffle过程存在不可避免的问题：

数据存储在本地磁盘，没有备份
IO 并发：大量 RPC 请求（M*R）
IO 吞吐：随机读、写放大（3X）
GC 频繁，影响 NodeManager

为了优化该问题，有很多公司都做了思路相近的优化，push shuffle

Facebook： cosco
LinkedIn：magnet
Uber：Zeus
Alibaba： RSS
Tencent： FireStorm
Bytedance： Cloud Shuffle Service
Spark3.2： push based shuffle

1 Magnet主要流程

Spark driver组件,协调整体的shuffle操作
map任务的shuffle writer过程完成后,增加了一个额外的操作push-merge,将数据复制份推到远程shuffle服务上
magnet shuffle service是一个强化版的ESS。将隶属于同一个shuffle partition的block,会在远程传输到magnet后被merge到一个文件中
reduce任务Amagnet shuffle service 接收合并好的shuffle数据

2 实现原理：

bitmap: 存储Emerge的mapper id, 防止重复merge
position offset: 如果本次block没有正常merge,可以恢复到上一个block的位置
currentMapld: 标识当前正在append的block,保证不同mapper 的block能依次append

主要为边写边push的模式，在原有的shuffle基础上尝试push聚合数据，但并不强制完成，读取时优先读取push聚合的结果，对于没有来得及完成聚合或者聚合失败的情况，则fallback到原模式

3 Magnet 可靠性

如果Map task输出的Block没有成功Push到magnet上,并且反复重试仍然失败,则reducetask直接从ESS上拉取原始block数据
如果magnet上的block因为重复或者冲突等原因,没有正常完成merge的过程,则reducetask直接拉取未完成merge的block
如果reduce拉取已经merge好的block失败,则会直接拉取merge前的原始block
本质上, magnet中维护了两份shuffle数据的副本

4 Cloud Shuffle Service 思想

[外链图片转存失败,源站可能有防盗链机制,建议将图片保存下来直接上传(img-82JnEti8-1661440964552)(image/image_vN88KGZRLN.png)]

5 Cloud Shuffle Service架构

6 Cloud Shuffle Service 读写流程

写入

读取

Cloud Shuffle Service 支持AQE

一个Partition会最终对应到多个Epoch file, 每个EPoch 目前设置是512MB

五、总结

Shuffle 概述：

数据shuffle的概念，其存在的意义以及基本流程
Shuffle为什么对性能影响很重要

Shuffle算子

常见的Shuffle算子
理解宽依赖与窄依赖，ShuffleDependency及其相关组件

shuffle过程

Spark中shuffle实现的历史
Spark中主流版本的shuffle写入和读取过程

Push shuffle

Magnet Push Shuffle的设计思路
Cloud Shuffle Service 的设计实现思路

问题：

自己构造一个会产生shuffle 的spark作业，修改shuffle相关的参数，对比一下不同参数对作业运行的影响
在spark中shuffle实现的发展过程中，每一次变化都优化了之前哪些缺点，又带来了哪些问题？
Push Shuffle相对比Fetch Shuffle最大的挑战是什么？

🌹写在最后💖：路漫漫其修远兮，吾将上下而求索！伙伴们，再见！🌹🌹🌹

文章标签：

云原生大数据计算服务 MaxCompute

Java

分布式计算

Spark

存储

大数据

关键词：

计算云原生大数据计算服务 MaxCompute

云原生大数据计算服务 MaxCompute青训营

云原生大数据计算服务 MaxCompute shuffle原理实践

云原生大数据计算服务 MaxCompute shuffle原理

相关实践学习

基于MaxCompute的热门话题分析

Apsara Clouder大数据专项技能认证配套课程：基于MaxCompute的热门话题分析

梦想new的出来

目录

相关文章

xxrjl

|

12月前

|

存储分布式计算大数据

MaxCompute聚簇优化推荐功能发布，单日节省2PB Shuffle、7000+CU！

MaxCompute全新推出了聚簇优化推荐功能。该功能基于 31 天历史运行数据，每日自动输出全局最优 Hash Cluster Key，对于10 GB以上的大型Shuffle场景，这一功能将直接带来显著的成本优化。

xxrjl

462 3 3

青云交（Java大数据AI云原生Python）

|

12月前

|

存储数据采集搜索推荐

Java 大视界 -- Java 大数据在智慧文旅旅游景区游客情感分析与服务改进中的应用实践（226）

本篇文章探讨了 Java 大数据在智慧文旅景区中的创新应用，重点分析了如何通过数据采集、情感分析与可视化等技术，挖掘游客情感需求，进而优化景区服务。文章结合实际案例，展示了 Java 在数据处理与智能推荐等方面的强大能力，为文旅行业的智慧化升级提供了可行路径。

青云交（Java大数据AI云原生Python）

468 0 0

Java 大视界 -- Java 大数据在智慧文旅旅游景区游客情感分析与服务改进中的应用实践（226）

Aron_NeAr

|

数据采集 SQL 搜索推荐

大数据之路：阿里巴巴大数据实践——OneData数据中台体系

OneData是阿里巴巴内部实现数据整合与管理的方法体系与工具，旨在解决指标混乱、数据孤岛等问题。通过规范定义、模型设计与工具平台三层架构，实现数据标准化与高效开发，提升数据质量与应用效率。

Aron_NeAr

3588 0 0

大数据之路：阿里巴巴大数据实践——OneData数据中台体系

Aron_NeAr

|

存储 SQL 分布式计算

大数据之路：阿里巴巴大数据实践——元数据与计算管理

本内容系统讲解了大数据体系中的元数据管理与计算优化。元数据部分涵盖技术、业务与管理元数据的分类及平台工具，并介绍血缘捕获、智能推荐与冷热分级等技术创新。元数据应用于数据标签、门户管理与建模分析。计算管理方面，深入探讨资源调度失衡、数据倾斜、小文件及长尾任务等问题，提出HBO与CBO优化策略及任务治理方案，全面提升资源利用率与任务执行效率。

Aron_NeAr

801 0 0

Wenzhuang

|

11月前

|

存储 SQL 分布式计算

MaxCompute 聚簇优化推荐原理

基于历史查询智能推荐Clustered表，显著降低计算成本，提升数仓性能。

Wenzhuang

574 4 4

MaxCompute 聚簇优化推荐原理

basu2023

|

10月前

|

人工智能 Cloud Native 算法

拔俗云原生 AI 临床大数据平台：赋能医学科研的开发者实践

AI临床大数据科研平台依托阿里云、腾讯云，打通医疗数据孤岛，提供从数据治理到模型落地的全链路支持。通过联邦学习、弹性算力与安全合规技术，实现跨机构协作与高效训练，助力开发者提升科研效率，推动医学AI创新落地。（238字）

basu2023

620 7 7

Aron_NeAr

|

存储监控大数据

大数据之路：阿里巴巴大数据实践——事实表设计

事实表是数据仓库核心，用于记录可度量的业务事件，支持高性能查询与低成本存储。主要包含事务事实表（记录原子事件）、周期快照表（捕获状态）和累积快照表（追踪流程）。设计需遵循粒度统一、事实可加性、一致性等原则，提升扩展性与分析效率。

Aron_NeAr

899 0 0

青云交（Java大数据AI云原生Python）

|

存储搜索推荐算法

Java 大视界 -- Java 大数据在智慧文旅旅游线路规划与游客流量均衡调控中的应用实践（196）

本实践案例深入探讨了Java大数据技术在智慧文旅中的创新应用，聚焦旅游线路规划与游客流量调控难题。通过整合多源数据、构建用户画像、开发个性化推荐算法及流量预测模型，实现了旅游线路的精准推荐与流量的科学调控。在某旅游城市的落地实践中，游客满意度显著提升，景区流量分布更加均衡，充分展现了Java大数据技术在推动文旅产业智能化升级中的核心价值与广阔前景。

青云交（Java大数据AI云原生Python）

565 0 0

Aron_NeAr

|

存储分布式计算大数据

大数据之路：阿里巴巴大数据实践——大数据领域建模综述

数据建模解决数据冗余、资源浪费、一致性缺失及开发低效等核心问题，通过分层设计提升性能10~100倍，优化存储与计算成本，保障数据质量并提升开发效率。相比关系数据库，数据仓库采用维度建模与列式存储，支持高效分析。阿里巴巴采用Kimball模型与分层架构，实现OLAP场景下的高性能计算与实时离线一体化。

Aron_NeAr

1226 0 0

Echo_Wish

|

11月前

|

机器学习/深度学习传感器分布式计算

数据才是真救命的：聊聊如何用大数据提升灾难预警的精准度

数据才是真救命的：聊聊如何用大数据提升灾难预警的精准度

Echo_Wish

657 14 14

热门文章

最新文章

阿里云大数据利器之-RDS迁移到Maxcompute实现动态分区

MaxCompute问答整理之9月

AI加持的阿里云飞天大数据平台技术揭秘

2016大数据创新大赛——机场客流量的时空分布预测模型解析

阿里云TSDB在大数据集群监控中的方案与实战

如何使用Tunnel SDK上传/下载MaxCompute复杂类型数据

AI时代Python金融大数据分析实战：ChatGPT让金融大数据分析插上翅膀

DTS数据同步集成MaxCompute数仓

大数据生态中的 RocketMQ 5.0

《Spark大数据处理：技术、应用与性能优化》——2.2　Spark集群初试

当“爆款书”遇上大数据：出版业的老路，正在被算法改写

基于python大数据的台风灾害分析及预测系统

基于Python大数据的热门游戏推荐系统

基于python大数据的青少年网络使用情况分析及预测系统

2026版基于python大数据的电影分析可视化系统

基于Python大数据的的电商用户行为分析系统

基于python大数据技术的医疗数据分析与研究

别再靠“拍脑袋”修系统了——聊聊大数据如何让运维更聪明

基于python大数据深度学习的酒店评论文本情感分析系统

基于python大数据的的海洋气象数据可视化平台

相关课程

更多

大数据Impala教程

大数据Spark2020最新课程（知识精讲与实战演练）第二阶段

大数据Spark2020版（知识精讲与实战演练）第三阶段

大数据Spark2020版（知识精讲与实战演练）第四阶段

2020版大数据实战项目之DMP广告系统（第四阶段）

2020版大数据实战项目之DMP广告系统（第六阶段）

相关电子书

更多

MaxCompute Serverless 架构演进

Data+AI时代大数据平台应该如何建设

大数据AI一体化的解读

下一篇

一条命令迁移，帮你实现 OpenClaw 与 Hermes Agent 记忆互通！