文档备案控制台

开发者社区大数据与机器学习正文

我现在基于Hologres引擎搭建了一套自动化数据分析平台，其中sql是自动生成的，当sql较复杂？

问题1:我现在基于Hologres引擎搭建了一套自动化数据分析平台，其中sql是自动生成的，当sql较复杂时，执行会比较慢，有大佬可以指导一下吗？问题2:这个问题很大呀。。

方法论上一般就是先通过query log找到慢的sql https://help.aliyun.com/document_detail/216963.html?spm=a2c4g.183398.0.i2

然后根据query log里展示的plan和调优文档去对比，看是不是符合调优文档的某些bad case https://help.aliyun.com/document_detail/183398.html?spm=a2c4g.162563.0.0.5bc63f68R5OGsR这个问题是有点大，主要原因在于我的sql是自动生成的，无法按照具体物理表的情况取调优所以找慢sql和单独表的调优对我不是太适用，是想看看有没有标准的优化方案，sql/user分级是怎么做的，这块不太了解，sql之间相互干扰这个暂时不存在，因为并发还比较少，主要是单sql的优化，我现在单独运行一个复杂sql需要花费1.5秒左右，能优化到500ms是最好的

展开

收起

真的很搞笑 2023-05-16 17:39:08 462 版权

版权声明：本文内容由阿里云实名注册用户自发贡献，版权归原作者所有，阿里云开发者社区不拥有其著作权，亦不承担相应法律责任。具体规则请查看《阿里云开发者社区用户服务协议》和《阿里云开发者社区知识产权保护指引》。如果您发现本社区中有涉嫌抄袭的内容，填写侵权投诉表单进行举报，一经查实，本社区将立刻删除涉嫌侵权内容。

1 条回答

写回答

取消提交回答

芯在这

回答1:有个文档，可以参考看看： https://help.aliyun.com/document_detail/183398.html?spm=a2c4g.461881.0.0.79926a8f05san2 还有就是把explain analyze <最关键的慢sql>; 的结果发出来看看。回答2:优化有修改物理表的属性，也有修改sql。

你可以看看是不是靠前者就能提升性能。可以针对下sql/user进行分级？控制下影响面？比如两实例，一个是识别过比较稳定的sql, 一个是跑未知的。我理解你提到的事情可能包含两部分： 1. 降低sql之间相互干扰 2. 真正慢sql优化。如果想要降低sql之间干扰，可以考虑：将比较复杂sql(简单点判断下长度超过阈值)或按user路由到一个独立的实例(只读实例）, 减少user与user之前的干扰，以及bad sql影响正常的sql？优化sql层面, 比较通用是扩大资源，其它可以请教下 @上唐看看有没有什么好的想法。，此回答整理自钉群“实时数仓Hologres交流群”

2023-05-16 17:49:00

赞同展开评论

问答分类：

SQL 数据挖掘实时数仓 Hologres

问答标签：

自动化平台实时数仓 Hologres平台数据分析平台 SQL数据分析 hologres数据分析

问答地址：

开发者社区 > 大数据与机器学习 > 问答

相关问答

hologres在服务里用psycopg2连接Holo，不定时进行sql查询，跑一会连接就断开了?

442

1

0

快手在实时数仓开发中为什么选择在某些场景使用API而不是SQL？

268

1

0

在实时数仓Hologres中有些sql, where条件里只有多字段in , 这个能优化吗？

267

0

0

DataWorks中hologres sql节点里遇到一个oom的报错？

167

0

0

机器学习PAI新建特征平台项目一定要配置 Hologres吗？

236

2

0

用sql检查实时数仓Holo自动加载时，报错是为什么？

203

1

0

检查实时数仓Holo自动加载是否开启的sql是什么？

230

1

0

在实时数仓Hologres中hologres 有query_log之类的吗用户的查询sql如何导出？

244

1

0

hologres写入相关的文档有吗？就是发起一个写入的sql后，hologres内部是如何去处理?

407

2

0

在Hologres中，现在holoweb上执行sql，以及打开表格都会报错，怎么解决？

214

1

0

大数据与机器学习

大数据领域前沿技术分享与交流，这里不止有技术干货、学习心得、企业实践、社区活动，还有未来。

我要提问

相关文章

分布式数据库分片策略怎么设计？透明分片实践 —— 阿里云 PolarDB-X

性能瓶颈的“诊断优先级”：CPU、IO、内存、网络，先查哪个？

数据库 AI 助手是什么？智能运维与诊断详解 —— 阿里云 PolarDB-X

分布式 JOIN 怎么优化？下推、广播、Co-located JOIN 实战 —— 阿里云 PolarDB-X

数据治理工具哪家好？2026年使用体验测评

相关解决方案

更多

构建实时/离线一体化数据分析平台

基于 Hologres 的广告创投一体化

一站式搭建短剧平台

HappyHorse 打造一站式影视创作平台

漫剧工坊：一站式动画创作平台

热门讨论

热门文章

ODPS 的下一个15年，大数据将迎来春天还是寒冬？

P人出游，你是否需要一个懂你更懂规划的AI导游呢？来搭建专属文旅问答机器人吧

Flink CDC刚刚写了几条数据，但是里面有点问题，其他字段都是正常的。这是咋回事呀？

Flink CDC任务从savepoint/checkpoints状态中恢复作业错误问题

数据服务报429请求次数过多咋办呀

Flink cdc sqlserver 希望不同步某些数据行

数据来源：com.alibaba.fastjson.JSONException: syntax er

在DataWorks上使用PyODPS使用限制是什么？

哪位有编译好的cdc 2.2.0版本能能试用flink 1.14.2的包呀？

Segment Key主要应用在哪些场景？

展开全部

身怀绝技的开发者们，快来DataV玩转可视化组件

阿里封神谈hadoop生态学习之路

【玩转数据系列十】利用阿里云机器学习在深度学习框架下实现智能图片分类

你刚吃的兰州牛肉面，背后就藏着大数据

大数据环境下该如何优雅地设计数据分层

odps是什么?

ajax请求总是不成功？浏览器的同源策略和跨域问题详解

数据仓库介绍与实时数仓案例

DataV接入ECharts图表库可视化利器强强联手

分布式快照算法: Chandy-Lamport

展开全部

还有其他疑问?