开发者社区> 问答> 正文

如何使用MapReduce实现两表join?

在两种情况下:(1)一个表大,一个表小(可放到内存中) (2)两个表均是大表,如何使用MapReduce实现两表join?

展开
收起
游客ysk6odvtzspxs 2021-12-05 11:18:25 413 0
1 条回答
写回答
取消 提交回答
  • 第一种情况比较简单,只需将小表放到DistributedCache中即可;第二种情况常用的方法有:map-side join(要求输入数据有序,通常用户HBase中的数据表连接),reduce-side join,semi join(半连接)等

    2021-12-05 11:18:52
    赞同 展开评论 打赏
问答排行榜
最热
最新

相关电子书

更多
基于E-MapReduce梨视频推荐系统 立即下载
大数据解决方案构建详解 以阿里云E-MapReduce为例 立即下载
阿里云E-MapReduce 立即下载