开发者社区 > 大数据与机器学习 > 大数据计算 MaxCompute > 正文

大数据计算MaxCompute加速为啥感觉是会变慢?

大数据计算MaxCompute加速为啥感觉是会变慢?以前慢是因为抢不到调度资源

展开
收起
真的很搞笑 2023-11-05 10:03:39 103 0
5 条回答
写回答
取消 提交回答
  • 作业慢的原因和DataWorks调度资源是否充足、MaxCompute计算资源是否充足、SQL复杂度以及数据量都有关系,跟查询加速没关系。,此回答整理自钉群“MaxCompute开发者社区2群”

    2023-11-07 22:48:18
    赞同 展开评论 打赏
  • 感觉MaxCompute加速变慢的原因可能有多种。首先,可能是由于数据分布不均导致的长尾问题,即数据在各个节点的分布不均匀,使得最慢的节点成为了整个任务的瓶颈。这种情况下,整个任务需要等待最慢的节点完成后才能继续,因此会感觉到加速效果不明显或者甚至变慢。

    其次,MaxCompute的并行度也会影响执行速度。一般情况下,并行度越大,处理速度越快。然而,如果并行度过大,可能会占用过多的系统资源,导致其他任务都在等待资源,从而影响整体的执行速度。

    此外,Hologres通过SQE与MaxCompute深度整合,可以提供极致性能的查询加速。在Hologres中加速查询MaxCompute有两种方式:创建外表和导入内表。相比在MaxCompute中直接查询,这两种方式都可以显著提高查询性能。

    最后,MaxCompute还支持将MCQA(MaxCompute Query Acceleration)查询作业的运行结果写入临时缓存中。当用户后续执行相同的查询作业时,MaxCompute会优先返回缓存中的结果,从而加快执行速度。

    2023-11-06 11:31:54
    赞同 展开评论 打赏
  • 面对过去,不要迷离;面对未来,不必彷徨;活在今天,你只要把自己完全展示给别人看。

    如果大数据计算MaxCompute加速反而变得更慢,这可能是由于以下几个原因导致的:

    1. 数据量过大:如果你的数据量非常大,那么即使加速也无法解决根本问题,因为处理大量数据本身就是一项繁重的任务。
    2. 网络问题:如果网络状况不佳,那么加速可能不会带来太大的效果。这是因为加速主要是通过减少数据传输的时间来提高速度,而网络状况差则会导致数据传输的速度降低。
    3. 服务器资源不足:如果服务器资源不足以满足MaxCompute的需求,那么加速也无法取得预期的效果。这是因为加速是建立在服务器能够快速处理数据的基础之上,而资源不足则会导致服务器无法正常运作。
    2023-11-05 15:54:57
    赞同 展开评论 打赏
  • 这可能有几个原因:

    1. 当前集群正在忙于处理其他作业,导致调度资源不足。在这种情况下,您可以考虑提高MaxCompute项目的并发度,以确保有足够的调度资源来运行您的作业。
    2. 数据倾斜可能导致某些任务长时间无法完成,进而影响整个作业的执行速度。您可以检查任务执行情况,并优化数据分布,以避免数据倾斜的发生。
    3. 如果您的作业包含大量的shuffle操作,那么磁盘I/O瓶颈也可能会影响整体性能。您可以考虑使用更高效的算法或优化shuffle操作,以减少磁盘I/O的影响。
    4. 如果您的作业依赖于外部服务或数据源,那么网络延迟或其他外部因素也可能会影响作业的执行速度。在这种情况下,您可以考虑优化外部组件的性能,以提高整体效率。
    2023-11-05 15:41:32
    赞同 展开评论 打赏
  • 受服务构架限制,MaxCompute Tunnel服务在以下几种场景中会出现偶发的请求延迟问题(单次上传、下载10MB数据耗时从秒级增长到分钟级)。

    共享Tunnel服务资源用满(CPU/网络带宽)

    持续时间:几分钟~几小时。

    受服务架构限制无法避免,有强保障需求的用户,可以购买独享资源Tunnel。

    客户端到Tunnel服务网络链路不稳定(公网上传/下载)

    持续时间:无法评估。

    公网稳定性无法保障,稳定性要求高的用户建议使用阿里云内网。

    客户端资源用满(CPU/网络带宽)

    持续时间:无法评估。

    需要用户对客户端物理资源做充分的评估。

    客户端代码逻辑不合理(长连接做上传、下载过程有耗时很长的数据处理逻辑)

    持续时间:无法评估。

    需要用户在代码设计上充分考虑数据传输性能。

    https://help.aliyun.com/zh/maxcompute/user-guide/overview-of-dts?spm=a2c4g.11186623.0.i66

    2023-11-05 12:17:21
    赞同 展开评论 打赏

MaxCompute(原ODPS)是一项面向分析的大数据计算服务,它以Serverless架构提供快速、全托管的在线数据仓库服务,消除传统数据平台在资源扩展性和弹性方面的限制,最小化用户运维投入,使您经济并高效的分析处理海量数据。

相关产品

  • 云原生大数据计算服务 MaxCompute
  • 相关电子书

    更多
    Data+AI时代大数据平台应该如何建设 立即下载
    大数据AI一体化的解读 立即下载
    极氪大数据 Serverless 应用实践 立即下载