MapJoin: 主要是对大表join小表的优化 如果左右表都是大表 会出现 使用了MapJoin也不会提高运行速度的情况
这个是MaxCompute MapJoin说明文档中的一个限制
https://help.aliyun.com/document_detail/73785.html?spm=a2c4g.11174283.6.635.719c590epmvNVw
猜想:
只要主动放入内存,速度必然要比不主动放入内存也就是普通算法快,无论什么查询,full join也不例外;
推论:
MaxCompute Mapjoin限制full join使用,可能是即使提升效率但性价比不高,所以没有采用,从程序角度考虑如果不出错的情况下,应该是允许使用的,所以这个解释有点牵强;
那可能是程序算法上Mapjoin与full join有冲突错误导致限制,这个解释稍微合理一些;
其他未知问题。
不知道友是否赞同?
这两个不是一个概念吧?
Full outer join是全连接,返回左右表中的所有记录。
MapJoin是Hive的一种优化操作,适用于小表JOIN大表的场景,这时表的JOIN操作是在Map端且在内存进行的。
版权声明:本文内容由阿里云实名注册用户自发贡献,版权归原作者所有,阿里云开发者社区不拥有其著作权,亦不承担相应法律责任。具体规则请查看《阿里云开发者社区用户服务协议》和《阿里云开发者社区知识产权保护指引》。如果您发现本社区中有涉嫌抄袭的内容,填写侵权投诉表单进行举报,一经查实,本社区将立刻删除涉嫌侵权内容。