备案控制台

开发者社区 > ModelScope模型即服务 > 计算机视觉 > 正文

ModelScope中，cpu不能部署量化的模型么？

ModelScope中，cpu不能部署量化的模型么，，optimum和auto-gptq这两个包都已经装好了

展开

收起

多麻辣哦 2023-11-08 20:32:54 123 0

2 条回答

写回答

取消提交回答

小周sir

面对过去，不要迷离；面对未来，不必彷徨；活在今天，你只要把自己完全展示给别人看。
不完全是这样的。虽然 ModelScope 侧重于使用 GPU 推理，但也支持 CPU 推理。在 CPU 上部署量化模型有一些限制和注意事项，需要考虑如下几点：
- 量化模型是为了加速推理，但是相较于 GPU 加速效果，CPU 加速效果相对较差，这是因为 CPU 不支持张量核心运算。
- 量化模型可能需要特定的编译器，您需要确保您的设备具有合适的编译器环境。
- CPU 对模型大小有一定的限制，因此您需要确保您的模型大小适合在 CPU 上运行。
2023-11-09 14:20:27

赞同展开评论打赏
sunrr

在ModelScope中，CPU确实可以部署量化的模型。如果您没有GPU硬件，也可以在CPU上进行推理，但需要注意的是，推理速度可能会更慢。同时，您可以在ModelScope平台上针对模型部署信息进行配置，包括部署模型版本、部署地域、部署卡型、部署显存等。

对于您已经安装的optimum和auto-gptq包，这两个包都是基于GPTQ算法的大语言模型量化工具包，使用它们可以更方便地进行模型推理和训练。安装完成后，您可以在Transformers中运行GPTQ模型，例如：从transformers模块导入AutoModelForCausalLM，然后使用from_pretrained方法加载预训练的模型。如果您使用的是CUDA 11.7或11.8，还可以通过pip install auto-gptq --extra-index-url命令来快速安装与PyTorch 2.0.1相兼容的AutoGPTQ的预构建轮子文件。

2023-11-09 11:06:39

赞同展开评论打赏

相关问答

modelscope-funasr在windows(cpu)上跑要多大的内存?

33

0

0

ModelScope为啥使用notebook的cpu版本，finetune.sh脚本去训练一直失败？

29

1

0

modelscope-funasr这个量化模型在哪里下载？

24

0

0

modelscope-funasr这里怎么写死cpu？

58

1

0

modelscope-funasr最新的gpu高吞吐服务用的模型和原来cpu的参数量是一样的么？

24

0

0

modelscope-funasr最新的gpu高吞吐服务用的模型和原来cpu的是一样的么？

26

0

0

在modelscope上git上这个语句报错，我是CPU版本，怎么回事？

47

1

0

ModelScope中示例页面的GPU版本和CPU版本。这两个不同版本会影响推理效率吗？

40

1

0

在modelscope-funasr中使用cpu运行需要多大内存？

21

0

0

ModelScope没有看见复制，模型选择、cpu/GPU选择有特别要求吗，有详细说明吗？

25

1

0

ModelScope模型即服务

计算机视觉

包含图像分类、图像生成、人体人脸识别、动作识别、目标分割、视频生成、卡通画、视觉评价、三维视觉等多个领域

我要提问

热门讨论

热门文章

ModelScope中，模型下载默认路径在哪个路径？

com/action/joingroup?code=v1是什么意思

请问在 ModelScope 上的模型断网使用报这个错误啥原因了?

服务器上onnxruntime-gpu 调用结束，如何释放显存

我希望通过damo-YOLO训练1500*1500的图片

如何下载modelscope模型？

ModelScope中，大佬们4卡跑lora时，遇到这样的错，怎么解决？

ModelScope 使用14B模型推理时报这个错误？

ttsfrd 如何在windows安装

请问modelscope中，有一个依赖，kantts，要怎么安装？

展开全部

YOLOv10实战：SPPF原创自研 | SPPF_attention，重新设计加入注意力机制 | NEU-DET为案列进行展开

关于flux.1 loras的8个问题

YOLOv10实战：红外小目标实战 | 多头检测器提升小目标检测精度

关键点检测从入门到进阶

Stable Diffusion 介绍与入门

一种基于YOLOv8改进的高精度红外小目标检测算法（原创自研）

人像增强修复

达摩院OpenVI-视频目标跟踪ICASSP 2023 Oral 渐进式上下文Transformer跟踪器 ProContEXT

ModelScope模型使用与EAS部署调用

展开全部

相关课程

更多

个性化语音合成模型微调

248

1

去学习

ModelScope社区Library技术架构介绍

225

1

去学习

相关电子书

更多

视觉AI能力的开放现状及ModelScope实战 立即下载

ModelScope助力语音AI模型创新与应用 立即下载

低代码开发师（初级）实战教程 立即下载