开发者社区> 问答> 正文

MaxCompute SQL中的clustered by的作用是什么?

MaxCompute SQL中的clustered by的作用是什么?

展开
收起
游客k7rjnht6hbtk6 2021-12-08 10:41:16 751 0
1 条回答
写回答
取消 提交回答
  • 1.clustered by指定Hash Key。MaxCompute将对指定列进行Hash运算,按照Hash值分散到各个Bucket中。

    2.为避免数据倾斜和热点,取得较好的并行执行效果,clustered by列适宜选择取值范围大,重复键值少的列。此外,为了达到join优化的目的,也应该考虑选取常用的Join/Aggregation Key,即类似于传统数据库中的主键。

    2021-12-08 10:41:36
    赞同 展开评论 打赏
问答排行榜
最热
最新

相关电子书

更多
Data+AI时代大数据平台应该如何建设 立即下载
大数据AI一体化的解读 立即下载
极氪大数据 Serverless 应用实践 立即下载