文档备案控制台

开发者社区大数据与机器学习实时数仓 Hologres 正文

分布键 distribution key 在Hologres 起了什么作用？

分布键 distribution key 在Hologres 起了什么作用？

展开

收起

1358896759097293 2021-03-25 11:03:42 2119 版权

版权声明：本文内容由阿里云实名注册用户自发贡献，版权归原作者所有，阿里云开发者社区不拥有其著作权，亦不承担相应法律责任。具体规则请查看《阿里云开发者社区用户服务协议》和《阿里云开发者社区知识产权保护指引》。如果您发现本社区中有涉嫌抄袭的内容，填写侵权投诉表单进行举报，一经查实，本社区将立刻删除涉嫌侵权内容。

1 条回答

写回答

取消提交回答

1358896759097293

45271990@qq.com

Hologres 是一个分布式的计算引擎，如果没有设置分布键，数据库表默认为随机分布形式，数据将被随机分配到各个 shard 上；如果用户指定了分布列，数据将按照指定列，将数据 shuffle 到各个 shard，同样的数值肯定会在同样的 shard 中。当用户以分布列做过滤条件时，Hologres 可以直接筛选出数据相关的 shard 进行扫描；当用户以分布列做 join 条件时，Hologres 不需要再次将数据 shuffle 到其他计算节点，直接在本节点 join 本节点数据即可，可以大大提高执行效率；同时如果用户 group by 的 key 是分布列也可以减少一次数据 shuffle，对整个查询的性能带来非常大的提升。  对于有 pk 的表，其分布键默认就是 pk，如果不想 pk 字段作为分布键，可以指定 pk 字段的子集，但是不能随意指定。  可以通过 shard_count 来指定表的 shard 数，如果不指定的话每个数据库都有一个默认的 shard 数，一旦指定了一个表的 shard 数，其他的表如果想要和这个表做 local join，就必须指定 colcate with 这个表。下图所示是一个通过分布键设置来加速两个表做 join 的场景。

2021-03-25 14:06:11

赞同展开评论

问答分类：

实时数仓 Hologres

问答地址：

开发者社区 > 大数据与机器学习 > 实时数仓 Hologres > 问答

相关问答

支付宝H5 下载的时候，提示【请确保该下载文件来源安全,如需浏览,请长按网址复制后使用浏览器访问】

288552

11

0

购买阿里国外的云服务器是否可以访问谷歌？

93896

50

0

this xml file does not appear to have any style in

62278

11

0

基础语言百问-Python

70545

30

0

访问ECS服务器的网站提示“由于你访问的URL可能对网站造成安全威胁，您的访问被阻断”，这是什么原因？

143124

16

0

#支付宝授权提示请在支付宝客户端打开链接

25840

19

0

阿里云怎样设置二级域名以及域名解析？

67114

14

0

全息（Holography）技术是什么技术？

1418

1

0

搭建dnf私服需要大概啥配置的

10852

2

0

com/action/joingroup?code=v1是什么意思

224257

21

0

大数据与机器学习

实时数仓 Hologres

本技术圈将为大家分析有关阿里云产品Hologres的最新产品动态、技术解读等，也欢迎大家加入钉钉群--实时数仓Hologres交流群32314975

我要提问

收录在圈子:

实时数仓Hologres

2633

+ 订阅

本技术圈将为大家分析有关阿里云产品Hologres的最新产品动态、技术解读等，也欢迎大家加入钉钉群--实时数仓Hologres交流群32314975

相关文章

分链路差异化设计的DSP准实时数仓｜钛动科技基于阿里云实时计算 Flink 版 + DLF Paimon + EMR Serverless StarRocks 的实践

传统数仓、实时数仓、云数仓有什么区别？大厂架构师终于讲明白了

EMR + Flink 实战：从离线T+1到实时数仓的完整迁移路径

Hologres + Flink 实时OLAP分析实战：从T+1报表到秒级洞察的数据平台

大数据分析用什么云数据仓库？兼容 MySQL 的实时数仓选型

热门讨论

热门文章

hologres如何使用jpa或者mybatisPlus进行操作？

Hologres分区删除语法

多余数据关联中的数据孤岛指的是什么？如何在无需数据搬迁的情况下实现联合分析的？

有人知道server busy是什么情况吗？

Hologres text字段类型比varchar占用的空间更多吗？

Hologres之前用的ttl来管理生命周期的，应该怎么同时保证读写高并发性能？

Hologres如何查看分区表？

Hologres 比特编码列设置和字典编码列设置分别要注意什么？

Hologres 升级到 2.0 后，执行sql有长度限制了？这个设置怎么样设置长一些"inter

目前可视化界面Holoweb表的字段还不支持删除吧，看删除、上移和下移都是灰色的，这是后续会考虑支持

展开全部

Hologres揭秘:深度解析高效率分布式查询引擎

实时数仓 Hologres产品使用合集之有没有MySQL那样的AUTOINCREMENT字段来实现自增ID功能

Hologres 4.0全新发布：AI时代的一站式多模态分析平台

Hologres实时湖仓能力入门实践

Hologres揭秘：高性能原生加速MaxCompute核心原理

技术揭秘：从双11看实时数仓Hologres高可用设计与实践

一条 SQL 生成广告：Hologres 如何实现素材生成到投放分析一体化

【云栖实录】Hologres3.0全新升级：一体化实时湖仓平台

一站式实时数仓Hologres整体能力介绍—2024实时数仓Hologres公开课 01

Hologres Dynamic Table：高效增量刷新，构建实时统一数仓的核心利器

展开全部

还有其他疑问?