EMR Remote Shuffle Service实践问题之Mapper的首次PushData请求如何解决-阿里云开发者社区

EMR Remote Shuffle Service实践问题之Mapper的首次PushData请求如何解决

2024-08-23 187

版权

本文内容由阿里云实名注册用户自发贡献，版权归原作者所有，阿里云开发者社区不拥有其著作权，亦不承担相应法律责任。具体规则请查看《阿里云开发者社区用户服务协议》和《阿里云开发者社区知识产权保护指引》。如果您发现本社区中有涉嫌抄袭的内容，填写侵权投诉表单进行举报，一经查实，本社区将立刻删除涉嫌侵权内容。

简介： EMR Remote Shuffle Service实践问题之Mapper的首次PushData请求如何解决

问题一：阿里云RSS如何处理Mapper的首次PushData请求？

阿里云RSS如何处理Mapper的首次PushData请求？

参考回答：

Mapper在首次PushData时会请求Master分配Worker资源，Worker记录自己所需要服务的Partition列表。

关于本问题的更多问答可点击原文查看：

https://developer.aliyun.com/ask/670753

问题二：在阿里云RSS中，数据超过内存阈值时是如何处理的？

在阿里云RSS中，数据超过内存阈值时是如何处理的？

参考回答：

当Mapper缓存的Shuffle数据超过内存阈值时，会触发Push操作，将隶属同个Partition的数据推送到同一个Worker进行合并。

关于本问题的更多问答可点击原文查看：

https://developer.aliyun.com/ask/670755

问题三：阿里云RSS如何实现数据的Replication？

阿里云RSS如何实现数据的Replication？

参考回答：

在阿里云RSS中，数据达成内存两副本是通过主Worker在接收到数据后立即向从Worker发起Replication来实现的。

关于本问题的更多问答可点击原文查看：

https://developer.aliyun.com/ask/670757

问题四：阿里云RSS如何处理Mapper Stage运行结束后的剩余数据？

阿里云RSS如何处理Mapper Stage运行结束后的剩余数据？

参考回答：

Mapper Stage运行结束后，MetaService会向Worker发起CommitFiles命令，Worker将残留在内存的数据全部刷盘并返回文件列表。

关于本问题的更多问答可点击原文查看：

https://developer.aliyun.com/ask/670760

问题五：在阿里云RSS中，Reducer如何读取Shuffle数据？

在阿里云RSS中，Reducer如何读取Shuffle数据？

参考回答：

Reducer从MetaService返回的文件列表中读取对应的Shuffle数据。

关于本问题的更多问答可点击原文查看：

https://developer.aliyun.com/ask/670762

EMR Remote Shuffle Service实践问题之Mapper的首次PushData请求如何解决

问题一：阿里云RSS如何处理Mapper的首次PushData请求？

问题二：在阿里云RSS中，数据超过内存阈值时是如何处理的？

问题三：阿里云RSS如何实现数据的Replication？

问题四：阿里云RSS如何处理Mapper Stage运行结束后的剩余数据？

问题五：在阿里云RSS中，Reducer如何读取Shuffle数据？

热门文章

最新文章

相关课程

相关电子书

相关实验场景

探索云世界

热门

云计算

大数据

云原生

人工智能

数据库

开发与运维

活动广场

任务中心

训练营

直播

乘风者计划

下载

镜像站

技术资料

EMR Remote Shuffle Service实践问题之Mapper的首次PushData请求如何解决

问题一：阿里云RSS如何处理Mapper的首次PushData请求？

问题二：在阿里云RSS中，数据超过内存阈值时是如何处理的？

问题三：阿里云RSS如何实现数据的Replication？

问题四：阿里云RSS如何处理Mapper Stage运行结束后的剩余数据？

问题五：在阿里云RSS中，Reducer如何读取Shuffle数据？

热门文章

最新文章

相关课程

相关电子书

相关实验场景