开发者社区> 问答> 正文

Hive中distribute by和cluster by的区别有哪些?

Hive中distribute by和cluster by的区别有哪些?

展开
收起
游客5n3d3br4o5qn4 2021-12-06 17:07:40 478 0
1 条回答
写回答
取消 提交回答
  • distribute by:类似MR的Partition,对key进行分区,结合sort by实现分区排序 cluster by:当distribute by和sort by的字段相同时,可以使用cluster by代替,但cluster by只能是升序,不能指定排序规则

    2021-12-06 17:07:58
    赞同 展开评论 打赏
问答分类:
问答标签:
问答地址:
问答排行榜
最热
最新

相关电子书

更多
Hive Bucketing in Apache Spark 立即下载
spark替代HIVE实现ETL作业 立即下载
2019大数据技术公开课第五季—Hive迁移到MaxCompute最佳实践 立即下载