MaxCompute SQL优化时聚合运算优化数据倾斜,导致长尾该如何操作呢?
系统自动处理(消耗更多资源):odpssqlgroupbyskewindata=true;
手动修改SQL:select pidcount(price)from sales group by pid;//如果key存在大量缺省无效值“-1”
修改后:select newpid,count(price)from(select case when pid= "-1” then
concat(rand0."default")else pid end as new pid from sales) group by newpid
调整并发度setodps.sql.joinerinstances=1111
版权声明:本文内容由阿里云实名注册用户自发贡献,版权归原作者所有,阿里云开发者社区不拥有其著作权,亦不承担相应法律责任。具体规则请查看《阿里云开发者社区用户服务协议》和《阿里云开发者社区知识产权保护指引》。如果您发现本社区中有涉嫌抄袭的内容,填写侵权投诉表单进行举报,一经查实,本社区将立刻删除涉嫌侵权内容。