备案控制台

开发者社区大数据与机器学习实时数仓 Hologres 正文

Hologres扫描6个分区（6个分区数据量大概是1.5亿条），还有优化空间吗？

Hologres扫描6个分区（6个分区数据量大概是1.5亿条），只查 count(distinct user_id) 的话，查询时间2秒左右，还有优化空间吗？

展开

收起

真的很搞笑 2023-12-18 08:06:04 144 版权

版权声明：本文内容由阿里云实名注册用户自发贡献，版权归原作者所有，阿里云开发者社区不拥有其著作权，亦不承担相应法律责任。具体规则请查看《阿里云开发者社区用户服务协议》和《阿里云开发者社区知识产权保护指引》。如果您发现本社区中有涉嫌抄袭的内容，填写侵权投诉表单进行举报，一经查实，本社区将立刻删除涉嫌侵权内容。

2 条回答

写回答

取消提交回答

小周sir

面对过去，不要迷离；面对未来，不必彷徨；活在今天，你只要把自己完全展示给别人看。
Hologres的查询性能与数据分布、索引等因素有关。针对您的情况，可以考虑以下优化方案：
1. 使用更高效的聚合函数：可以尝试使用其他聚合函数，如SUM(DISTINCT user_id)代替COUNT(DISTINCT user_id)，因为SUM函数在处理大量重复值时比COUNT函数更快。
2. 添加索引：如果user_id字段没有建立索引，可以考虑添加索引来提高查询效率。但是需要注意的是，添加索引会增加存储空间和写入时间，因此需要权衡利弊。
3. 分区键的选择：如果表的分区键选择不当，可能会导致查询时需要扫描大量的数据。因此，可以考虑重新评估表的分区键选择是否合理。
4. 调整系统参数：可以通过调整Hologres的系统参数来提高查询性能，例如增加内存大小、调整并发线程数等。
5. 使用缓存：如果查询结果不经常变化，可以考虑将查询结果缓存起来，以减少重复查询的时间消耗。
2023-12-18 14:43:58

赞同展开评论
芯在这

在MC侧基于user_id列做成hash bucket 应该有一定改善。如果是高频使用，这个在holo内表，采用user_id做distribution key，应该是可以毫秒级的。，此回答整理自钉群“实时数仓Hologres交流群”

2023-12-18 10:59:36

赞同展开评论

问答分类：

实时数仓 Hologres

问答标签：

实时数仓 Hologres优化实时数仓 Hologres分区实时数仓 Hologres空间实时数仓 Hologres数据量实时数仓 Hologres分区数据量

问答地址：

开发者社区 > 大数据与机器学习 > 实时数仓 Hologres > 问答

相关问答

实时数仓 Hologres

想问下，Hologres创建动态分区，按天调度，但是为什么没有执行？

134

1

0

dataworks里面的hologres，256个CU大概有多少的存储空间呀？

207

2

0

在实时数仓Hologres中，一天约有100GB左右的增量单字段最长可能为10MB，有何优化建议吗？

152

0

0

实时数仓Hologres一张表在maxcomoute分区为日期-date，对应的国家应该设置为什么？

126

0

0

在实时数仓Hologres中有些sql, where条件里只有多字段in , 这个能优化吗？

161

0

0

Hologres在哪些方面进行了优化以提升计算力？

83

1

0

Hologres 的 table_name 是子分区的表名？

107

1

0

在Hologres中比如A实例读订单表，B实例查询也读订单表，但是数据量较大，IO会有瓶颈吗？

114

0

0

在Hologres中字段信息（例如字段英文名、中文名、主键、分区等），用哪些表进行关联获取呢？

163

0

0

在Hologres中使用Holo往OSS的外部表写数据的时候出现了OOM这是对写入的数据量有限制吗？

94

0

0

大数据与机器学习

实时数仓 Hologres

本技术圈将为大家分析有关阿里云产品Hologres的最新产品动态、技术解读等，也欢迎大家加入钉钉群--实时数仓Hologres交流群32314975

我要提问

相关文章

Hologres 4.0全新发布：AI时代的一站式多模态分析平台

理想汽车基于 Hologres + Flink 构建万亿级车联网信号实时分析平台

云栖实录｜驰骋在数据洪流上：Flink+Hologres驱动零跑科技实时计算的应用与实践

云栖实录｜理想汽车基于 Hologres + Flink 构建万亿级车联网信号实时分析平台

通义AI搜索排名优化全攻略

热门讨论

热门文章

CCO是什么？

Hologres中datav 价格怎么样？

hologres在服务里用psycopg2连接Holo，不定时进行sql查询，跑一会连接就断开了?

请问下 hologres 不支持 lateral view explode 么

有人知道server busy是什么情况吗？

Hologres 升级到 2.0 后，执行sql有长度限制了？这个设置怎么样设置长一些"inter

Hologres建表字符串默认都是bitmap索引，如果字符串的是高基数的，会不会有影响？

Hologres和ADB的区别是什么，这两个产品应该怎么选型？

MySQL跟Hologres的两大产品区别是什么呢？

Hologres最核心的组件是什么？

展开全部

通义AI搜索排名优化全攻略

Hologres揭秘:深度解析高效率分布式查询引擎

钱大妈数据中台建设最佳实践

Hologres 4.0全新发布：AI时代的一站式多模态分析平台

飞书深诺基于Flink+Hudi+Hologres的实时数据湖建设实践

10亿+/秒！看阿里如何搞定实时数仓高吞吐实时写入与更新

Hologres+Flink企业级实时数仓核心能力介绍

首次公开！阿里巴巴云原生实时数仓核心技术揭秘

Hologres+函数计算+Qwen3，对接MCP构建企业级数据分析 Agent

小红书推荐大数据在阿里云上的实践

展开全部

还有其他疑问?