文档备案控制台

开发者社区问答正文

Hive SQL与MaxCompute SQL在分区分桶上的区别是什么？

Hive SQL与MaxCompute SQL在分区分桶上的区别是什么？

展开

收起

游客qzzytmszf3zhq 2021-12-08 21:30:11 562 版权

版权声明：本文内容由阿里云实名注册用户自发贡献，版权归原作者所有，阿里云开发者社区不拥有其著作权，亦不承担相应法律责任。具体规则请查看《阿里云开发者社区用户服务协议》和《阿里云开发者社区知识产权保护指引》。如果您发现本社区中有涉嫌抄袭的内容，填写侵权投诉表单进行举报，一经查实，本社区将立刻删除涉嫌侵权内容。

1 条回答

写回答

取消提交回答

游客yzrzs5mf6j7yy

在Hive中使用分桶命令需要执行命令hive.enforce.bucketiong=true；使用关键字clustered by指定分区依据的列名，以及指定分桶数。在MaxCompute中是底层进行分桶操作。在MaxCompute中可以在建表时指定clustered by中的Hash Key，MaxCompute将对指定列进行Hash运算，根据Hash值分散到各个Bucket中。为避免数据倾斜和热点，取得较好的并行执行效果，clustered by字段列宜选择取值范围大、重复键值少的列。为达到join优化目的，应考虑选取常用的Join/Aggregation Key，即类似传统数据库中的主键。

2021-12-08 21:30:41

赞同展开评论

问答分类：

SQL 分布式计算 MaxCompute HIVE 云原生大数据计算服务 MaxCompute

问答标签：

sql云原生大数据计算服务 MaxCompute 云原生大数据计算服务 MaxCompute sql maxcompute SQL 云原生大数据计算服务 MaxCompute hive SQL区别

问答地址：

开发者社区 > 大数据 > 问答

相关问答

MaxCompute打开hive兼容后为什么所有decimal最终数据结果都是整型

170

1

0

MaxCompute分桶排序无效

135

1

0

MaxCompute有没有类似hive hive -e执行sql这种命令

172

1

0

在大数据计算MaxCompute中，资源花费这里区别是哪里？

278

1

0

大数据计算MaxCompute从hive表将数据以orc方式写入oss,然后mc再将这些数据load

211

1

0

大数据计算MaxCompute这种外部表直连的，要选 Hive 兼容类型吗？

145

1

0

大数据计算MaxCompute 不是一个账户下的hive数据可以同步到odps吗？

153

1

0

大数据计算MaxCompute这里是有什么限制？或者这两个类型有什么区别呢？

226

1

0

大数据计算MaxCompute是不支持主键吗？还是有版本区别？

261

0

0

大数据计算MaxComputer中dataworks 里面的参数调度中括号和花括号有什么区别吗？

199

1

0

问答排行榜

最热

最新

【大咖问答】对话PostgreSQL 中国社区发起人之一，阿里云数据库高级专家德哥

据说在家办公的程序员是这样写代码的？

如何升级配置

【藏经阁一起读（27）】本周推荐《Apache Flink案例集（2022版）》，你有哪些心得？

【精品问答】python技术1000问(1)

2026年阿里云服务器租用价格表：新版特惠与常规价格完整清单

2026年阿里云服务器多少钱一年？全品类租用价格明细汇总

2026年阿里云服务器价格明细：一年/按月/按小时计费标准汇总

2026年阿里云服务器租用价格详解：年付月付费用完整清单

2026年阿里云服务器一年/一月费用表：轻量/ECS/GPU全品类报价

相关文章

DBA必备技能：MySQL误删恢复完全指南（全量备份+binlog回放）

【MySQL】MVCC多版本并发控制：核心原理、Read View、undo log版本链、RC/RR隔离级别的差异控制（附《高频面试题》+流程图）

【MySQL】高可用：主从复制原理、主从延迟解决方案、半同步复制、MGR

【MySQL】《MySQL高可用面试核心考点问答清单+常见陷阱题与易错点总结》

【Azure 应用服务】WEBSITE_DISABLE_CROSS_STAMP_SCALE 配置的作用说明

还有其他疑问?