开发者社区 > 大数据与机器学习 > 人工智能平台PAI > 正文

机器学习PAI中我们有个问题哈,我们监控发现,cpu利用率不高,内存利用率也不高但是rt会出现异常?

机器学习PAI中我们有个问题哈,我们监控发现,cpu利用率不高,内存利用率也不高,但是rt会出现异常高间断的情况?

展开
收起
真的很搞笑 2023-10-24 21:09:18 127 0
3 条回答
写回答
取消 提交回答
  • 公众号:网络技术联盟站,InfoQ签约作者,阿里云社区签约作者,华为云 云享专家,BOSS直聘 创作王者,腾讯课堂创作领航员,博客+论坛:https://www.wljslmz.cn,工程师导航:https://www.wljslmz.com

    程序设计问题:机器学习算法的实现可能存在效率低下、算法复杂度过高等问题,这些都可能导致 RT 升高。

    2023-10-24 23:44:48
    赞同 展开评论 打赏
  • 如果在PAI中CPU和内存利用率不高,但是RT(响应时间)会出现异常高间断的情况,可能是因为以下原因之一:

    1. 数据库查询问题:如果你的应用程序使用了数据库查询,那么查询的响应时间可能会影响RT。如果查询执行得非常慢,那么RT可能会非常高。你可以检查数据库查询的性能,看看是否有可能优化的地方。
    2. 网络延迟问题:如果你的应用程序需要与外部系统交互,那么网络延迟可能会影响RT。如果你的网络连接不稳定,那么RT可能会非常高。你可以检查网络连接的性能,看看是否有可能优化的地方。
    3. 系统负载问题:如果系统负载过高,那么可能会导致RT升高。你可以检查系统的负载,看看是否有可能优化的地方。
    4. 应用程序性能问题:如果你的应用程序代码有问题,那么可能会导致RT升高。你可以检查应用程序的代码,看看是否有可能优化的地方。
      为了更好地诊断这个问题,你可以使用PAI提供的监控工具来查看应用程序的详细性能数据,例如CPU使用率、内存使用率、网络延迟、系统负载等。这将有助于你更好地理解问题的原因,并采取相应的措施来解决它。
    2023-10-24 21:40:39
    赞同 展开评论 打赏
  • RT主要取决于服务实例的代码逻辑,包括前处理后处理,以及模型推理等,建议先profile下服务内运行的代码,此回答整理自钉群“机器学习PAI交流群(答疑@值班)”

    2023-10-24 21:17:47
    赞同 展开评论 打赏

人工智能平台 PAI(Platform for AI,原机器学习平台PAI)是面向开发者和企业的机器学习/深度学习工程平台,提供包含数据标注、模型构建、模型训练、模型部署、推理优化在内的AI开发全链路服务,内置140+种优化算法,具备丰富的行业场景插件,为用户提供低门槛、高性能的云原生AI工程化能力。

相关产品

  • 人工智能平台 PAI
  • 热门讨论

    热门文章

    相关电子书

    更多
    大规模机器学习在蚂蚁+阿里的应用 立即下载
    基于Spark的面向十亿级别特征的 大规模机器学习 立即下载
    基于Spark的大规模机器学习在微博的应用 立即下载