"用千问1.5 72B量化后的模型,ModelScope中gpu只有一个在100%跑,其他gpu基本上是0怎么解决?
"
在使用ModelScope进行模型推理时,如果发现只有一个GPU在运行而其他GPU利用率很低,可以尝试以下几种方法来解决这个问题:
CUDA_VISIBLE_DEVICES
环境变量来指定哪些GPU参与计算。例如,如果您有多张GPU,但只想使用第一张和第三张,可以设置CUDA_VISIBLE_DEVICES=0,2
。这样,只有ID为0和2的GPU会被用于推理任务。总的来说,通过上述方法,您应该能够找到并解决只有一个GPU在运行的问题,从而提高ModelScope中模型推理的效率。
ModelScope旨在打造下一代开源的模型即服务共享平台,为泛AI开发者提供灵活、易用、低成本的一站式模型服务产品,让模型应用更简单!欢迎加入技术交流群:微信公众号:魔搭ModelScope社区,钉钉群号:44837352