可以看文档了解和体验一下,上手快。
本文为您介绍Hologres中的关键索引,如Distribution Key、Event Time Column(Segment Key)和Clustering Key,帮助您在Hologres开发过程中快速上手使用索引,提升查询性能。
分布式数据仓库Hologres基本运行原理
Hologres是一个分布式数据仓库,采用并行计算和向量计算技术实现秒级查询响应,因此数据的分布特征对性能有关键影响,包括数据在多个分布式节点间的分布均衡性(distribution_key),以及单个节点内文件之间的分布有序性(event_time_column/segment_key)。同时Hologres在OLAP场景默认使用列存储格式,因此数据在文件内的有序性(clustering_key)也至关重要。掌握这三个概念,在性能优化时可以事半功倍。由于数据分布特征是在数据写入时确定,调整成本高,因此建议在建表时,设计与数据布局相关的三个属性。而与数据布局无直接关联的属性,如位图索引(bitmap_columns),字典编码(dictionary_columns)等,可以在建表之后,按需调整。
同时Hologres的元数据采用三级结构Database>Schema>Table,建议逻辑相关的表内聚在Schema下,避免跨库查询。Database是元数据隔离的基本单位,不是资源隔离的单位。
版权声明:本文内容由阿里云实名注册用户自发贡献,版权归原作者所有,阿里云开发者社区不拥有其著作权,亦不承担相应法律责任。具体规则请查看《阿里云开发者社区用户服务协议》和《阿里云开发者社区知识产权保护指引》。如果您发现本社区中有涉嫌抄袭的内容,填写侵权投诉表单进行举报,一经查实,本社区将立刻删除涉嫌侵权内容。