大数据计算MaxCompute加速为啥感觉是会变慢?以前慢是因为抢不到调度资源
作业慢的原因和DataWorks调度资源是否充足、MaxCompute计算资源是否充足、SQL复杂度以及数据量都有关系,跟查询加速没关系。,此回答整理自钉群“MaxCompute开发者社区2群”
感觉MaxCompute加速变慢的原因可能有多种。首先,可能是由于数据分布不均导致的长尾问题,即数据在各个节点的分布不均匀,使得最慢的节点成为了整个任务的瓶颈。这种情况下,整个任务需要等待最慢的节点完成后才能继续,因此会感觉到加速效果不明显或者甚至变慢。
其次,MaxCompute的并行度也会影响执行速度。一般情况下,并行度越大,处理速度越快。然而,如果并行度过大,可能会占用过多的系统资源,导致其他任务都在等待资源,从而影响整体的执行速度。
此外,Hologres通过SQE与MaxCompute深度整合,可以提供极致性能的查询加速。在Hologres中加速查询MaxCompute有两种方式:创建外表和导入内表。相比在MaxCompute中直接查询,这两种方式都可以显著提高查询性能。
最后,MaxCompute还支持将MCQA(MaxCompute Query Acceleration)查询作业的运行结果写入临时缓存中。当用户后续执行相同的查询作业时,MaxCompute会优先返回缓存中的结果,从而加快执行速度。
如果大数据计算MaxCompute加速反而变得更慢,这可能是由于以下几个原因导致的:
这可能有几个原因:
受服务构架限制,MaxCompute Tunnel服务在以下几种场景中会出现偶发的请求延迟问题(单次上传、下载10MB数据耗时从秒级增长到分钟级)。
共享Tunnel服务资源用满(CPU/网络带宽)
持续时间:几分钟~几小时。
受服务架构限制无法避免,有强保障需求的用户,可以购买独享资源Tunnel。
客户端到Tunnel服务网络链路不稳定(公网上传/下载)
持续时间:无法评估。
公网稳定性无法保障,稳定性要求高的用户建议使用阿里云内网。
客户端资源用满(CPU/网络带宽)
持续时间:无法评估。
需要用户对客户端物理资源做充分的评估。
客户端代码逻辑不合理(长连接做上传、下载过程有耗时很长的数据处理逻辑)
持续时间:无法评估。
需要用户在代码设计上充分考虑数据传输性能。
https://help.aliyun.com/zh/maxcompute/user-guide/overview-of-dts?spm=a2c4g.11186623.0.i66
版权声明:本文内容由阿里云实名注册用户自发贡献,版权归原作者所有,阿里云开发者社区不拥有其著作权,亦不承担相应法律责任。具体规则请查看《阿里云开发者社区用户服务协议》和《阿里云开发者社区知识产权保护指引》。如果您发现本社区中有涉嫌抄袭的内容,填写侵权投诉表单进行举报,一经查实,本社区将立刻删除涉嫌侵权内容。
MaxCompute(原ODPS)是一项面向分析的大数据计算服务,它以Serverless架构提供快速、全托管的在线数据仓库服务,消除传统数据平台在资源扩展性和弹性方面的限制,最小化用户运维投入,使您经济并高效的分析处理海量数据。