开发者社区 问答 正文

map 端和shuffle端的作用是什么?

map 端和shuffle端的作用是什么?

展开
收起
游客mm5dulkpivqdo 2021-12-06 18:15:08 491 分享 版权
1 条回答
写回答
取消 提交回答
  • map 端:以 JOIN ON 条件中的列作为 Key,以page_view表中的需要字段,表标识作为value,最终通过key进行排序,也就是join字段进行排序。

    shuffle端:根据 Key 的值进行 Hash,并将 Key/Value 对按照 Hash 值推 至不同对 Reduce 中

    2021-12-06 18:15:53
    赞同 展开评论