开发者社区 问答 正文

如何使用MapReduce实现两表join?

在两种情况下:(1)一个表大,一个表小(可放到内存中) (2)两个表均是大表,如何使用MapReduce实现两表join?

展开
收起
游客ysk6odvtzspxs 2021-12-05 11:18:25 430 分享 版权
1 条回答
写回答
取消 提交回答
  • 第一种情况比较简单,只需将小表放到DistributedCache中即可;第二种情况常用的方法有:map-side join(要求输入数据有序,通常用户HBase中的数据表连接),reduce-side join,semi join(半连接)等

    2021-12-05 11:18:52
    赞同 展开评论