备案控制台

开发者社区 > ModelScope模型即服务 > 正文

请问下， modelscope中量化的模型，大概能降低多少配置要求呢？

"请问下， modelscope中量化的模型，大概能降低多少配置要求呢？

目前我试了下，我本地是deepin20.9系统，2核cpu，8g内存，nv730-2g。

部署ollama的qwen2-7b，有点卡一秒输出2-3字符，1.5b就很流畅。

但是魔搭云端好像是8cpu，32g内存，直接部署7b会爆，1.5b很流畅。

然后我的古董笔记本ollama部署0.5b都很卡。"

展开

收起

小小爱吃香菜 2024-06-19 08:24:53 49 0

1 条回答

写回答

取消提交回答

为了利利

8核32G内存ollama部署qwen2-7b不会爆，有点慢。此回答整理自钉群“魔搭ModelScope开发者联盟群 ①”

2024-06-19 08:34:29

赞同展开评论打赏

相关问答

modelscope-funasr这个量化模型在哪里下载？

21

0

0

modelscope-funasr的GPU离线转写服务的说话人识别模块要怎么配置啊？

35

0

0

modelscope-funasr的paraformer热词版本配置是不是不支持添加权重？

34

0

0

modelscope 需要什么特殊配置吗？

33

1

0

ModelScope的label值出不来，是哪里配置没做好吗？

11

1

0

在ModelScope上部署大模型RAG对话系统时，推荐使用的GPU服务器配置是什么？

32

0

0

ModelScope中，点击保存配置一直提示请校验配置参数格式，怎么办？

28

0

0

请问ModelScope中，qwen2-72b的服务器商用配置是什么？

38

1

0

ModelScope未量化模型推理很快，双卡推理也很快，只有4卡非常慢，怎么解决？

19

0

0

awq量化模型，启动时，报图中警告，并且ModelScope模型推理速度非常慢，这应该怎么办？

42

1

0

ModelScope模型即服务

ModelScope旨在打造下一代开源的模型即服务共享平台，为泛AI开发者提供灵活、易用、低成本的一站式模型服务产品，让模型应用更简单！欢迎加入技术交流群：微信公众号：魔搭ModelScope社区，钉钉群号：44837352

我要提问

热门讨论

热门文章

ModelScope中，模型下载默认路径在哪个路径？

ModelScope默认的下载位置是在哪里？

ModelScope有部署qwen2-72b的么，正常推理需要多大的显存？

modelscope-funasr的FunClip怎么安装的？

ModelScope qwen7b、14b、72b lora微调分别需要的显存和cpu内存是多少？

无法导入 modelscope，已经pip install了

服务器上onnxruntime-gpu 调用结束，如何释放显存

“锦书 - 创新艺术字”模型，运行报错。Error Connection errored out.

modelscope上跑报错，提示要pip install ttsfrd，搞不定

com/action/joingroup?code=v1是什么意思

展开全部

阿里云通义千问向全社会开放！

multi-agent：多角色Agent协同合作，高效完成复杂任务

Llama 3开源，魔搭社区手把手带你推理，部署，微调和评估

【机器学习技巧】回归模型的几个常用评估指标（R2、Adjusted-R2、MSE、RMSE、MAE、MAPE）及其在sklearn中的调用方式

【机器学习】集成学习——Stacking模型融合（理论+图解）

vanna+qwen实现私有模型的SQL转换

从RMSE和MSE到更多选择：探索机器学习模型性能指标

开源版图生视频I2VGen-XL：单张图片生成高质量视频

社区供稿 | 10G显存，通义千问-7B-int4消费级显卡最佳实践

NPU推理&微调大模型实战

展开全部

相关课程

更多

个性化语音合成模型微调

248

1

去学习

ModelScope社区Library技术架构介绍

224

1

去学习

相关电子书

更多

视觉AI能力的开放现状及ModelScope实战 立即下载

ModelScope助力语音AI模型创新与应用 立即下载

低代码开发师（初级）实战教程 立即下载