开发者社区> 问答> 正文

使用mapjoin的原因是什么?

使用mapjoin的原因是什么?

展开
收起
游客ysk6odvtzspxs 2021-12-05 09:59:29 528 0
1 条回答
写回答
取消 提交回答
  • 在进行表的连接时,在map端处理完数据后,会把不同表的数据,形成不同的文件,reduce端进行拉取map端获得文件时,由于map端文件不在一个节点 ,且由于表的大小不一,获得的相应的文件也会大小不一,特别是针对相差较大的大小表,更会在数据拉去的时候浪费资源,拖慢job进度。为此引入了mapjoin这种处理手断。

    2021-12-05 10:00:02
    赞同 展开评论 打赏
问答地址:
问答排行榜
最热
最新

相关电子书

更多
低代码开发师(初级)实战教程 立即下载
冬季实战营第三期:MySQL数据库进阶实战 立即下载
阿里巴巴DevOps 最佳实践手册 立即下载