机器学习PAI我们这边有个pai-eas服务rt尖刺很大,但是cpu和内存很低 可以帮忙看下什么情况吗?
从你提供的信息来看,PAI-EAS服务的RT(响应时间)尖刺很大,但是CPU和内存使用率很低。这可能表明该服务的处理能力不足,导致服务处理请求的速度较慢。建议您可以从以下几个方面进行排查:
如果你的PAI-EAS服务的RT(响应时间)很高,但CPU和内存的使用率却很低,可能有以下几种可能:
网络问题:可能是网络延迟或者网络不稳定导致的。
任务调度问题:可能是任务调度器的工作负载过大,导致任务的响应时间过长。
硬件问题:可能是服务器硬件出现问题,如硬盘IO瓶颈等。
软件问题:可能是PAI-EAS服务本身存在问题,如代码bug、配置问题等。
建议你检查一下网络状况,优化一下任务调度策略,检查一下服务器的硬件状态,以及检查一下PAI-EAS服务的代码和配置。
EAS的RT监控,你可以就理解为一个Nginx类似的网关的监控,记录一个请求从发给到容器的模型服务,到模型服务返回结果的时间。
这里的RT主要取决于你们的模型服务本身,包括模型,以及相关的业务代码。,此回答整理自钉群“机器学习PAI交流群(答疑@值班)”
版权声明:本文内容由阿里云实名注册用户自发贡献,版权归原作者所有,阿里云开发者社区不拥有其著作权,亦不承担相应法律责任。具体规则请查看《阿里云开发者社区用户服务协议》和《阿里云开发者社区知识产权保护指引》。如果您发现本社区中有涉嫌抄袭的内容,填写侵权投诉表单进行举报,一经查实,本社区将立刻删除涉嫌侵权内容。
人工智能平台 PAI(Platform for AI,原机器学习平台PAI)是面向开发者和企业的机器学习/深度学习工程平台,提供包含数据标注、模型构建、模型训练、模型部署、推理优化在内的AI开发全链路服务,内置140+种优化算法,具备丰富的行业场景插件,为用户提供低门槛、高性能的云原生AI工程化能力。