文档备案控制台

开发者社区 ModelScope模型即服务正文

请问下， modelscope中量化的模型，大概能降低多少配置要求呢？

"请问下， modelscope中量化的模型，大概能降低多少配置要求呢？

目前我试了下，我本地是deepin20.9系统，2核cpu，8g内存，nv730-2g。

部署ollama的qwen2-7b，有点卡一秒输出2-3字符，1.5b就很流畅。

但是魔搭云端好像是8cpu，32g内存，直接部署7b会爆，1.5b很流畅。

然后我的古董笔记本ollama部署0.5b都很卡。"

展开

收起

小小爱吃香菜 2024-06-19 08:24:53 295 版权

1 条回答

写回答

取消提交回答

为了利利

8核32G内存ollama部署qwen2-7b不会爆，有点慢。此回答整理自钉群“魔搭ModelScope开发者联盟群 ①”

2024-06-19 08:34:29

赞同展开评论

相关问答

modelscope-funasr这个量化模型在哪里下载？

373

0

0

modelscope-funasr的GPU离线转写服务的说话人识别模块要怎么配置啊？

437

0

0

modelscope-funasr的paraformer热词版本配置是不是不支持添加权重？

615

0

0

在modelscope-funasr中有没有配置支持一段话说完直接在这句话最后就加标点？

220

0

0

modelscope-funasr的识别说话人的功能要如何配置？

237

0

0

在ModelScope上部署大模型RAG对话系统时，推荐使用的GPU服务器配置是什么？

382

0

0

ModelScope中，点击保存配置一直提示请校验配置参数格式，怎么办？

203

0

0

ModelScope未量化模型推理很快，双卡推理也很快，只有4卡非常慢，怎么解决？

240

0

0

awq量化模型，启动时，报图中警告，并且ModelScope模型推理速度非常慢，这应该怎么办？

524

1

0

modelscope中使用:swift export，来合并量化模型，报错是为什么？

532

1

0

ModelScope模型即服务

ModelScope旨在打造下一代开源的模型即服务共享平台，为泛AI开发者提供灵活、易用、低成本的一站式模型服务产品，让模型应用更简单！欢迎加入技术交流群：微信公众号：魔搭ModelScope社区，钉钉答疑群：44837352

我要提问

相关解决方案

更多

GLM-5.2：长任务时代开源旗舰模型

基于 Spark 和 PyTorch 的模型训练方案

OpenAI 重磅开源，快速部署GPT-OSS模型

模型蒸馏：让0.6B模型媲美235B模型

一键训练模型及部署GPU共享推理服务

热门讨论

热门文章

com/action/joingroup?code=v1是什么意思

ModelScope中，模型下载默认路径在哪个路径？

ModelScope下载速度慢怎么解决？

请问Modelscope互联网如何访问Notebook的服务呢？

modelscope这个下载有点慢呀，好几次都超时了，怎么解决？

ModelScope这个免费额度可以在哪里查询啊？

ModelScope中apikey在哪申请？

我想问下ModelScope数据集的数据怎么获取？

ModelScope哪里可以下到bge的embedding啊，我用来本地部署？

IndexTTS 部署报错：No module named 'tn'

展开全部

中企投资印度新能源“有戏”吗？

GLM-4V-Flash：智谱 AI 免费开放的图像理解大模型 API 接口

MNN-LLM App：在手机上离线运行大模型，阿里巴巴开源基于 MNN-LLM 框架开发的手机 AI 助手应用

DeepSeek-V4开源：百万上下文，Agent能力比肩顶级闭源模型

嵌入式开发必备！Keil uVision5 C51 V9.61 安装激活 + 汉化完整教程, 含（Keil MDK 5.39）

ModelScope介绍：魔搭社区是什么？在魔搭社区能做哪些事？

Claude Code 四大定制机制完全指南：CLAUDE.md、Hooks、Skills、Subagents 怎么选怎么用

AgentScope：阿里开源多智能体低代码开发平台，支持一键导出源码、多种模型API和本地模型部署

使用宝塔面板部署 AstrBot 与 NapCat 实现 QQ 机器人

阿里云通义千问向全社会开放！

展开全部

还有其他疑问?