开发者社区 问答 正文

MaxCompute JOIN中的join产生的问题有哪些类型?

MaxCompute JOIN中的join产生的问题有哪些类型?

展开
收起
游客k7rjnht6hbtk6 2021-12-08 17:28:56 392 分享 版权
1 条回答
写回答
取消 提交回答
  • 1.数据倾斜问题:join会将key相同的数据分发到同一个instance上处理,如果某个key上的数据量特别多则会导致该instance处理时间比其他instance处理时间长,这就是我们常说的数据倾斜,这也是join计算性能问题的罪魁祸首;

    2.数据量问题:关联的两表基本没有热点问题,但两个表数据量都非常大同样会影响性能,比如记录数达几十亿条,如商品表、库存表等;

    2021-12-08 17:29:13
    赞同 展开评论