我在Hive中跟随两个查询以获得一些特定结果。
select * from table1 where col1 IN (a, b, c)
select * from table1 where col1=a OR col1=b OR col1=c
根据我的理解,IN将在内部转换为OR的序列。在spark-sql中本地执行但没有发现任何性能差异(如执行时序,过滤数据扫描等)。那么我们可以根据功能在IN和OR中看到什么区别。
Col1 in (a,b,c) is a macro that expands to Col1=a or Col1=b or Col1=c.
没有性能差异
版权声明:本文内容由阿里云实名注册用户自发贡献,版权归原作者所有,阿里云开发者社区不拥有其著作权,亦不承担相应法律责任。具体规则请查看《阿里云开发者社区用户服务协议》和《阿里云开发者社区知识产权保护指引》。如果您发现本社区中有涉嫌抄袭的内容,填写侵权投诉表单进行举报,一经查实,本社区将立刻删除涉嫌侵权内容。