备案控制台

开发者社区 ModelScope模型即服务正文

请问ModelScope显存够了吗，够了的话怎么解决爆显存的问题？

使用vllm部署Qwen2-54B-A14B-Instruct时会出现torch.cuda.OutOfMemoryError: CUDA out of memory. Tried to allocate 1.09 GiB. GPU has a total capacity of 22.03 GiB of which 540.88 MiB is free. Including non-PyTorch memory, this process has 21.50 GiB memory in use. Of the allocated memory 20.95 GiB is allocated by PyTorch, and 197.87 MiB is reserved by PyTorch but unallocated. If reserved but unallocated memory is large try setting PYTORCH_CUDA_ALLOC_CONF=expandable_segments:True to avoid fragmentation. See documentation for Memory Management (https://pytorch.org/docs/stable/notes/cuda.html#environment-variables) ，硬件是两张A10，有48G显存，请问ModelScope显存够了吗，够了的话怎么解决爆显存的问题？

展开

收起

小小爱吃香菜 2024-06-26 08:30:40 213 版权

1 条回答

写回答

取消提交回答

为了利利

不够。换个小一些的模型看看。此回答整理自钉群“魔搭ModelScope开发者联盟群 ①”

2024-06-28 19:58:50

赞同展开评论

相关问答

ModelScope 报显存不够如下图怎么解决？

319

1

0

modelscope-funasr的paraformer推理的显存是有什么决定的，为啥会不太稳定？

265

1

0

在modelscope-funasr当音频文件超过一个小时后，显存溢出怎么解决？

245

1

0

ModelScope有没有对各种大模型使用各种微调方法所需要显存的统计？

173

1

0

在modelscope-funasr我设4路的话，它的GPU显存占用就是4G吗？

116

1

0

modelscope-funasr的funclip，4g.显存不够如何解决？

114

0

0

modelscope-funasr的GPU推理的cpp版本内存和显存不回收的问题怎么解决？

147

0

0

在modelscope-funasr同样的文件，文本强制对齐，有时运行成功，有时运行爆显存，为什么？

189

1

0

ModelScope中，为什么用vllm推理比pt多了三倍的显存？

364

1

0

ModelScope中官方有没有文档或者明确说明支持哪些GPU呢，显存是24G的?

115

1

0

ModelScope模型即服务

ModelScope旨在打造下一代开源的模型即服务共享平台，为泛AI开发者提供灵活、易用、低成本的一站式模型服务产品，让模型应用更简单！欢迎加入技术交流群：微信公众号：魔搭ModelScope社区，钉钉群号：44837352

我要提问

相关文章

最新版：阿里云服务器购买、续费、升级配置价格表新鲜出炉

Fortinet FortiGate Firmware (FortiOS 7.6.5) 全系列下载 - 下一代防火墙 (NGFW)

成本与收益分析：主流证书的报考、学习时间与薪资回报率粗略模型

阿里云服务器 ECS 规格族解析：CPU 型号差异与性能参数对比

当算力变成“新石油”：AI 芯片的战争、底层逻辑与未来爆点

热门讨论

热门文章

我希望通过damo-YOLO训练1500*1500的图片

ModelScope中，模型下载默认路径在哪个路径？

ModelScope中apikey在哪申请？

dataset的版本问题导致与modelscope不兼容

ModelScope下载速度慢怎么解决？

如何下载modelscope模型？

在modelscope-funasr想自己训练一种low resource 的方言，有训练的方案吗？

com/action/joingroup?code=v1是什么意思

关于 Windows平台上 ttsfrd 库的问题。

modelscope这个下载有点慢呀，好几次都超时了，怎么解决？

展开全部

Z-Image：冲击体验上限的下一代图像生成模型

Qwen3-VL新成员 2B、32B来啦！更适合开发者体质

共学 | 2025年，更加有效地搭建Agent

中文大模型体验

MNN-LLM App：在手机上离线运行大模型，阿里巴巴开源基于 MNN-LLM 框架开发的手机 AI 助手应用

Agent Skills技术协议与开源实现，让大模型拥有“即插即用”技能

Z-Image Turbo LoRA训练魔法：如何保持加速生图能力

智胜未来：国内大模型+Agent应用案例精选，以及主流Agent框架开源项目推荐

Meta SAM3开源：让图像分割，听懂你的话

通义百聆语音双子星，同步开源！

展开全部

还有其他疑问?