开发者社区 问答 正文

避免数据倾斜的分布策略选择规则有哪些?

已解决

避免数据倾斜的分布策略选择规则有哪些?

展开
收起
云上静思 2022-11-03 12:26:23 358 分享 版权
来自: 阿里云认证
1 条回答
写回答
取消 提交回答
  • 推荐回答

    • 分布策略选择规则:

    ü 小表(总行数低于1 万)优先选择复制表分布策略(DISTRIBUTED REPLACATED)。

    ü 大表优先选择参与Join/GroupBy 计算的字段作为分布键Hash 分布。

    ü 若没有数据分布均匀的字段作为分布键使用,采用随机分布策略(DISTRIBUTED RANDOMLY)。

    以上内容摘自《阿里云认证的解析与实战-数据仓库ACP认证》电子书,点击https://developer.aliyun.com/ebook/download/7807 可下载完整版

    2022-11-03 14:16:23
    赞同 展开评论
问答地址: