备案控制台

开发者社区 ModelScope模型即服务正文

ModelScope中，为什么用vllm推理比pt多了三倍的显存？

"ModelScope中，为什么用vllm推理比pt多了三倍的显存？

"

展开

收起

小小爱吃香菜 2024-07-24 08:30:25 315 版权

1 条回答

写回答

取消提交回答

为了利利

vllm有显存预分配，--gpu_memory_utilization 此回答整理自钉群“魔搭ModelScope开发者联盟群 ①”

2024-07-24 16:22:24

赞同 1 展开评论

相关问答

modelscope-funasr的热词是只在推理阶段做吗？

155

0

0

想请问下ModelScope里Vllm部署了qwen1.5-32B之后，它无限输出日志怎么解决？

397

0

0

modelscope-funasr的CosyVoice 效果好极了，只是推理速度不能实时，有啥办法？

284

0

0

modelscope-funasr的paraformer推理的显存是有什么决定的，为啥会不太稳定？

182

1

0

在modelscope-funasr当音频文件超过一个小时后，显存溢出怎么解决？

214

1

0

modelscope-funasr的paraformer-zh模型现在推理输出，是带时间戳的吗？

373

1

0

modelscope里用vllm调用千问1.5-7b流式输出，没输出完就结束了，有限制输出多少字吗?

194

1

0

设置也无法指定gpu，是否在ModelScope模型内部修改代码？

130

2

0

14B 的ModelScope模型是可以预训练的吗？

142

1

0

modelscope-funasr微调非实时模型时，训练数据对应text文件的文字需要用空格隔开吗？

125

1

0

ModelScope模型即服务

ModelScope旨在打造下一代开源的模型即服务共享平台，为泛AI开发者提供灵活、易用、低成本的一站式模型服务产品，让模型应用更简单！欢迎加入技术交流群：微信公众号：魔搭ModelScope社区，钉钉群号：44837352

我要提问

热门讨论

热门文章

如何训练属于自己的AI大模型呢？有没有大佬有相关文档参考学习下

qwen3-32b和qwen-2.5-32b-Instruct有什么区别

dataset的版本问题导致与modelscope不兼容

ModelScope中，模型下载默认路径在哪个路径？

ModelScope中，大佬们4卡跑lora时，遇到这样的错，怎么解决？

我希望通过damo-YOLO训练1500*1500的图片

ModelScope下载速度慢怎么解决？

从modelscope下载模型失败，怎么回事？

modelscope-funasr模型选择whisper large v3，不出时间戳是正常的吗？

com/action/joingroup?code=v1是什么意思

展开全部

万字长文深度解析最新Deep Research技术：前沿架构、核心技术与未来展望

Qwen3-VL新成员 2B、32B来啦！更适合开发者体质

MNN-LLM App：在手机上离线运行大模型，阿里巴巴开源基于 MNN-LLM 框架开发的手机 AI 助手应用

仅100多元，他给视障人群装上AI“眼睛”

Qwen3-VL再添丁！4B/8B Dense模型开源，更轻量，仍强大

AgentScope：阿里开源多智能体低代码开发平台，支持一键导出源码、多种模型API和本地模型部署

MiniMax-M2 发布！10B激活，专为高效编码与Agent工作流而生

智胜未来：国内大模型+Agent应用案例精选，以及主流Agent框架开源项目推荐

Dolphin：40语种+22方言！清华联合海天瑞声推出的语音识别大模型，识别精度超Whisper两代

美团 LongCat-Video 视频生成模型正式发布，探索世界模型的第一步

展开全部

还有其他疑问?