备案控制台

开发者社区 ModelScope模型即服务正文

部署ModelScope默认直接填满第一个GPU，导致内存溢出，这个有解决办法吗？

qwen/Qwen-72B-Chat部署ModelScope默认直接填满第一个GPU，导致内存溢出，这个有解决办法吗？

展开

收起

小小爱吃香菜 2024-04-24 08:20:41 126 版权

1 条回答

写回答

取消提交回答

为了利利

vllm 部署的话，有个参数可以设置，--tensor_parallel_size 此回答整理自钉群“魔搭ModelScope开发者联盟群 ①”

2024-04-24 12:19:27

赞同展开评论

相关问答

千问Qwen3 32B大模型部署需要什么配置的GPU服务器？

1112

1

0

购买阿里云服务器部署mysql数据库,建议什么配置CPU/内存比？

73

1

0

千问Qwen3 14B大模型部署最低配置GPU服务器要求？

1027

1

0

DeepSeek 70B参数部署需要多少显存的GPU服务器，如何估算？

255

1

0

Qwen3 32B,14B,8B大模型部署分别需要多少显存，GPU服务器如何选？

3091

1

0

Funasr GPU2.0.0部署推理，RTF达不到0.0008，连0.0076都达不到。

195

0

0

在GPU服务器上使用魔搭部署deepseek70b大模型时，有一个文件出现校验之类的错误？

195

0

0

在云上部署ChatGLM2-6B大模型（GPU版）这个实验，最后无法访问网址

359

2

0

modelscope-funasr在windows(cpu)上跑要多大的内存?

220

0

0

docker部署modelscope-funasr如何识别不同人说话？

358

0

0

ModelScope模型即服务

ModelScope旨在打造下一代开源的模型即服务共享平台，为泛AI开发者提供灵活、易用、低成本的一站式模型服务产品，让模型应用更简单！欢迎加入技术交流群：微信公众号：魔搭ModelScope社区，钉钉群号：44837352

我要提问

相关文章

阿里云GPU服务器全解析：实例选型、收费标准与活动价格，超强算力与灵活购买

阿里云无影GPU云电脑：NVIDIA RTX 5880显卡收费价格表

Flash Decoding完整解决方案：从8倍加速原理到企业级部署实践

从代码到生产推理服务：DevPod 全流程部署 DeepSeek-OCR 模型实战指南

从帧到世界：面向世界模型的长视频生成

热门讨论

热门文章

ModelScope中，模型下载默认路径在哪个路径？

我希望通过damo-YOLO训练1500*1500的图片

dataset的版本问题导致与modelscope不兼容

ModelScope下载速度慢怎么解决？

如何下载modelscope模型？

qwen3-32b和qwen-2.5-32b-Instruct有什么区别

ModelScope有部署qwen2-72b的么，正常推理需要多大的显存？

ModelScope qwen7b、14b、72b lora微调分别需要的显存和cpu内存是多少？

modelscope这个下载有点慢呀，好几次都超时了，怎么解决？

ModelScope的PAI-DSW中，怎么上传一个文件夹？

展开全部

Qwen3-VL新成员 2B、32B来啦！更适合开发者体质

让AI单次生成4万字！WriteHERE：开源AI长文写作框架，单次生成超长文本，小说报告一键搞定！

MNN-LLM App：在手机上离线运行大模型，阿里巴巴开源基于 MNN-LLM 框架开发的手机 AI 助手应用

码上生花：用API链接Qwen-Image系列及衍生LoRA生态模型

Manga Image Translator：开源的漫画文字翻译工具，支持多语言翻译并嵌入原图，保持漫画的原始风格和布局

Meta SAM3开源：让图像分割，听懂你的话

ModelScope魔搭社区发布月报 -- 25年11月

AgentScope：阿里开源多智能体低代码开发平台，支持一键导出源码、多种模型API和本地模型部署

一文读懂“大语言模型”

智胜未来：国内大模型+Agent应用案例精选，以及主流Agent框架开源项目推荐

展开全部

还有其他疑问?