问题一:麻烦在帮忙看看Hologres?
麻烦在帮忙看看Hologres?
参考答案:
原因清楚了 这个是行存表 被insert了7000次 但update了4亿次 行存表采样真实的行数代价高 因此采用的估算法 用了insert+update的次数之和 所以这里提示4亿 但实际只有8000行 可以看到上面提示的rows=8449 实际扫描的 可以看[]里面的部分
关于本问题的更多回答可点击进行查看:
https://developer.aliyun.com/ask/579622
问题二:帮忙看看Hologres这是什么情况嘛?
帮忙看看Hologres这是什么情况嘛?dim_store表只有8k多条记录,但是我看执行计划是的时候是scan了4亿条记录。
参考答案:
这个表 analyze一下再看看 有可能频繁更新 统计信息不一定准确 预估是有可能不准确的
关于本问题的更多回答可点击进行查看:
https://developer.aliyun.com/ask/579619
问题三:Hologres试了下用hash bucket,文件数量多了好多,查询性能并没有更快,应该怎么优化?
Hologres试了下用hash bucket,文件数量多了好多,查询性能并没有更快,应该怎么优化? 这图是表里面一个分区的属性信息
参考答案:
你的查询 过滤条件有hash键 用上hash剪枝是优化的原理
关于本问题的更多回答可点击进行查看:
https://developer.aliyun.com/ask/579618
问题四:咨询下Hologres,IF函数还不支持不同類型是嗎?
咨询下Hologres,IF函数还不支持不同類型是嗎?
函数嵌套的时候改成相同的类型不报错,但外层函数不起作用,比如sum(IF("table_name" = '外卖', "people_qty", CAST('10' AS BIGINT))) AS aaa
参考答案:
二三入参都是int或者bigint,应该是能sum的
关于本问题的更多回答可点击进行查看:
https://developer.aliyun.com/ask/579617
问题五:Hologres扫描6个分区(6个分区数据量大概是1.5亿条),还有优化空间吗?
Hologres扫描6个分区(6个分区数据量大概是1.5亿条),只查 count(distinct user_id) 的话,查询时间2秒左右,还有优化空间吗?
参考答案:
在MC侧 基于user_id列做成hash bucket 应该有一定改善。如果是高频使用,这个在holo内表,采用user_id做distribution key,应该是可以毫秒级的。
关于本问题的更多回答可点击进行查看: