开发者社区 问答 正文

避免数据倾斜的分布策略选择规则有哪些?

已解决

避免数据倾斜的分布策略选择规则有哪些?

展开
收起
云上静思 2022-11-03 12:26:23 339 发布于北京 分享
分享
版权
来自: 阿里云认证 举报
1 条回答
写回答
取消 提交回答
  • 推荐回答

    • 分布策略选择规则:

    ü 小表(总行数低于1 万)优先选择复制表分布策略(DISTRIBUTED REPLACATED)。

    ü 大表优先选择参与Join/GroupBy 计算的字段作为分布键Hash 分布。

    ü 若没有数据分布均匀的字段作为分布键使用,采用随机分布策略(DISTRIBUTED RANDOMLY)。

    以上内容摘自《阿里云认证的解析与实战-数据仓库ACP认证》电子书,点击https://developer.aliyun.com/ebook/download/7807 可下载完整版

    2022-11-03 14:16:23 举报
    赞同 评论

    评论

    全部评论 (0)

    登录后可评论
问答地址:
AI助理

你好,我是AI助理

可以解答问题、推荐解决方案等