开发者社区> 问答> 正文

如何快速上手Hologres这样的实时数仓解决方案?

如何快速上手Hologres这样的实时数仓解决方案?

展开
收起
迪哒迪滴喵 2024-07-29 20:44:05 39 0
1 条回答
写回答
取消 提交回答
  • 可以看文档了解和体验一下,上手快。

    本文为您介绍Hologres中的关键索引,如Distribution Key、Event Time Column(Segment Key)和Clustering Key,帮助您在Hologres开发过程中快速上手使用索引,提升查询性能。

    分布式数据仓库Hologres基本运行原理
    Hologres是一个分布式数据仓库,采用并行计算和向量计算技术实现秒级查询响应,因此数据的分布特征对性能有关键影响,包括数据在多个分布式节点间的分布均衡性(distribution_key),以及单个节点内文件之间的分布有序性(event_time_column/segment_key)。同时Hologres在OLAP场景默认使用列存储格式,因此数据在文件内的有序性(clustering_key)也至关重要。掌握这三个概念,在性能优化时可以事半功倍。由于数据分布特征是在数据写入时确定,调整成本高,因此建议在建表时,设计与数据布局相关的三个属性。而与数据布局无直接关联的属性,如位图索引(bitmap_columns),字典编码(dictionary_columns)等,可以在建表之后,按需调整。

    同时Hologres的元数据采用三级结构Database>Schema>Table,建议逻辑相关的表内聚在Schema下,避免跨库查询。Database是元数据隔离的基本单位,不是资源隔离的单位。

    image.png
    参考文档https://help.aliyun.com/zh/hologres/getting-started/hologres-index-to-get-started-quickly?spm=a2c4g.11186623.0.0.6d2038f9wd9UI7

    2024-07-30 08:59:52
    赞同 2 展开评论 打赏
问答排行榜
最热
最新

相关电子书

更多
基于云原生数据仓库AnalyticDB PG的最佳实践 立即下载
新氧云原生全栈数仓最佳实践 立即下载
离线实时一体化数仓与湖仓一体—云原生大数据平台的持续演进 立即下载