开发者社区> 问答> 正文

为什么要在shuffer之前执行map-join,提前将数据进行聚合?

为什么要在shuffer之前执行map-join,提前将数据进行聚合?

展开
收起
游客ysk6odvtzspxs 2021-12-05 09:07:24 570 0
1 条回答
写回答
取消 提交回答
  • 一是为了避免将多数相同的key流入相同的reduce-task中,导致数据倾斜; 二是为了执行过程的高效,节省资源,充分利用资源,将在有限的资源里面做最有效的工作。

    2021-12-05 09:08:37
    赞同 展开评论 打赏
问答标签:
问答地址:
问答排行榜
最热
最新

相关电子书

更多
RowKey与索引设计:技巧与案例分析 立即下载
低代码开发师(初级)实战教程 立即下载
阿里巴巴DevOps 最佳实践手册 立即下载

相关实验场景

更多