开发者社区> 问答> 正文

MaxCompute Sql中的数据倾斜的优化方法及注意事项是什么?

MaxCompute Sql中的数据倾斜的优化方法及注意事项是什么?

展开
收起
游客k7rjnht6hbtk6 2021-12-08 17:51:04 616 0
1 条回答
写回答
取消 提交回答
  • 1.聚合倾斜,设置参数:set odps.sql.groupby.skewindata=true

    2.关联倾斜,设置参数:set odps.sql.skewinfo=tab1:(col1,col2)[(v1,v2),(v3,v4),...|(v1,v2),(v3,v4),...];set odps.sql.optimize.skewjoin=true

    3.关联倾斜,同时大小表,考虑修改为mapjoin

    4.具体问题具体分析:因为聚合key值null引起的数据倾斜,可以修改null为随机值,打撒数据分发到不同的instance执行

    2021-12-08 17:51:30
    赞同 展开评论 打赏
问答排行榜
最热
最新

相关电子书

更多
SQL Server在电子商务中的应用与实践 立即下载
GeoMesa on Spark SQL 立即下载
原生SQL on Hadoop引擎- Apache HAWQ 2.x最新技术解密malili 立即下载