开发者社区 > 大数据与机器学习 > 人工智能平台PAI > 正文

机器学习PAI我们这边有个pai-eas服务rt尖刺很大,但是cpu和内存很低 帮忙看下什么情况吗?

机器学习PAI我们这边有个pai-eas服务rt尖刺很大,但是cpu和内存很低 可以帮忙看下什么情况吗?

展开
收起
真的很搞笑 2023-10-22 22:16:01 101 0
3 条回答
写回答
取消 提交回答
  • 面对过去,不要迷离;面对未来,不必彷徨;活在今天,你只要把自己完全展示给别人看。

    从你提供的信息来看,PAI-EAS服务的RT(响应时间)尖刺很大,但是CPU和内存使用率很低。这可能表明该服务的处理能力不足,导致服务处理请求的速度较慢。建议您可以从以下几个方面进行排查:

    1. 检查PAI-EAS服务的负载情况。如果负载较低,可能是因为服务的处理能力不足。您可以尝试增加服务的处理能力,例如增加服务的CPU和内存资源。
    2. 检查PAI-EAS服务的代码。如果服务的代码存在问题,可能会导致服务处理请求的速度较慢。您可以尝试优化服务的代码,以提高服务的处理能力。
    3. 检查PAI-EAS服务的网络环境。如果服务的网络环境存在问题,可能会导致服务处理请求的速度较慢。您可以尝试优化服务的网络环境,以提高服务的处理能力。
    4. 检查PAI-EAS服务的硬件设备。如果服务的硬件设备存在问题,可能会导致服务处理请求的速度较慢。您可以尝试更换服务的硬件设备,以提高服务的处理能力。
    2023-10-23 13:35:31
    赞同 展开评论 打赏
  • 如果你的PAI-EAS服务的RT(响应时间)很高,但CPU和内存的使用率却很低,可能有以下几种可能:

    1. 网络问题:可能是网络延迟或者网络不稳定导致的。

    2. 任务调度问题:可能是任务调度器的工作负载过大,导致任务的响应时间过长。

    3. 硬件问题:可能是服务器硬件出现问题,如硬盘IO瓶颈等。

    4. 软件问题:可能是PAI-EAS服务本身存在问题,如代码bug、配置问题等。

    建议你检查一下网络状况,优化一下任务调度策略,检查一下服务器的硬件状态,以及检查一下PAI-EAS服务的代码和配置。

    2023-10-23 11:00:14
    赞同 展开评论 打赏
  • EAS的RT监控,你可以就理解为一个Nginx类似的网关的监控,记录一个请求从发给到容器的模型服务,到模型服务返回结果的时间。
    这里的RT主要取决于你们的模型服务本身,包括模型,以及相关的业务代码。,此回答整理自钉群“机器学习PAI交流群(答疑@值班)”

    2023-10-23 08:06:59
    赞同 展开评论 打赏

人工智能平台 PAI(Platform for AI,原机器学习平台PAI)是面向开发者和企业的机器学习/深度学习工程平台,提供包含数据标注、模型构建、模型训练、模型部署、推理优化在内的AI开发全链路服务,内置140+种优化算法,具备丰富的行业场景插件,为用户提供低门槛、高性能的云原生AI工程化能力。

相关产品

  • 人工智能平台 PAI
  • 热门讨论

    热门文章

    相关电子书

    更多
    大规模机器学习在蚂蚁+阿里的应用 立即下载
    阿里巴巴机器学习平台AI 立即下载
    微博机器学习平台架构和实践 立即下载