开发者社区 > ModelScope模型即服务 > 计算机视觉 > 正文

ModelScope中,cpu不能部署量化的模型么?

ModelScope中,cpu不能部署量化的模型么,27dfc6e2724362655e3480ab70560db1.png66370c6adf544aad845e91666a8b522d.png,optimum和auto-gptq这两个包都已经装好了

展开
收起
多麻辣哦 2023-11-08 20:32:54 153 0
2 条回答
写回答
取消 提交回答
  • 面对过去,不要迷离;面对未来,不必彷徨;活在今天,你只要把自己完全展示给别人看。

    不完全是这样的。虽然 ModelScope 侧重于使用 GPU 推理,但也支持 CPU 推理。在 CPU 上部署量化模型有一些限制和注意事项,需要考虑如下几点:

    • 量化模型是为了加速推理,但是相较于 GPU 加速效果,CPU 加速效果相对较差,这是因为 CPU 不支持张量核心运算。
    • 量化模型可能需要特定的编译器,您需要确保您的设备具有合适的编译器环境。
    • CPU 对模型大小有一定的限制,因此您需要确保您的模型大小适合在 CPU 上运行。
    2023-11-09 14:20:27
    赞同 展开评论 打赏
  • 在ModelScope中,CPU确实可以部署量化的模型。如果您没有GPU硬件,也可以在CPU上进行推理,但需要注意的是,推理速度可能会更慢。同时,您可以在ModelScope平台上针对模型部署信息进行配置,包括部署模型版本、部署地域、部署卡型、部署显存等。

    对于您已经安装的optimum和auto-gptq包,这两个包都是基于GPTQ算法的大语言模型量化工具包,使用它们可以更方便地进行模型推理和训练。安装完成后,您可以在Transformers中运行GPTQ模型,例如:从transformers模块导入AutoModelForCausalLM,然后使用from_pretrained方法加载预训练的模型。如果您使用的是CUDA 11.7或11.8,还可以通过pip install auto-gptq --extra-index-url命令来快速安装与PyTorch 2.0.1相兼容的AutoGPTQ的预构建轮子文件。

    2023-11-09 11:06:39
    赞同 展开评论 打赏

包含图像分类、图像生成、人体人脸识别、动作识别、目标分割、视频生成、卡通画、视觉评价、三维视觉等多个领域

热门讨论

热门文章

相关电子书

更多
视觉AI能力的开放现状及ModelScope实战 立即下载
ModelScope助力语音AI模型创新与应用 立即下载
RDS SQL Server CPU高使用率性能优化 立即下载