备案控制台

开发者社区 ModelScope模型即服务正文

ModelScope中，仅推理的显存占用量，与推理请求的并发量没有太大关系对吧？

"ModelScope中，仅推理的显存占用量，与推理请求的并发量没有太大关系对吧？
"

展开

收起

小小爱吃香菜 2024-03-12 20:21:27 232 版权

1 条回答

写回答

取消提交回答

为了利利

"max_new_tokens和history也会影响显存。vllm推理的话，可以设置--gpu_memory_utilization，https://github.com/modelscope/swift/blob/main/docs/source/LLM/%E5%91%BD%E4%BB%A4%E8%A1%8C%E5%8F%82%E6%95%B0.md
此回答整理自钉群“魔搭ModelScope开发者联盟群 ①”"

2024-03-12 21:04:57

赞同展开评论

相关问答

ModelScope如何用英特尔显卡进行推理，目前pytorch已经支持，求大神帮帮忙。

171

1

0

modelscope-funasr的热词是只在推理阶段做吗？

195

0

0

ModelScope 报显存不够如下图怎么解决？

313

1

0

在modelscope-funasr需要100路ASR并发的话，需要什么资源吗？

297

0

0

在modelscope-funasr用一块4090来跑funasr能支持到多少路并发？

348

0

0

modelscope-funasr的paraformer推理的显存是有什么决定的，为啥会不太稳定？

263

1

0

modelscope-funasr有没有python版实时转写并发解决方案？

176

0

0

在modelscope-funasr当音频文件超过一个小时后，显存溢出怎么解决？

243

1

0

在modelscope-funasr中推理的输出结果准确率要比直接推理的低，是参数有问题吗？

188

1

0

ModelScope中，把推理脚本改成这样了，报下面的错，怎么解决？

114

1

0

ModelScope模型即服务

ModelScope旨在打造下一代开源的模型即服务共享平台，为泛AI开发者提供灵活、易用、低成本的一站式模型服务产品，让模型应用更简单！欢迎加入技术交流群：微信公众号：魔搭ModelScope社区，钉钉群号：44837352

我要提问

热门讨论

热门文章

我希望通过damo-YOLO训练1500*1500的图片

ModelScope中，模型下载默认路径在哪个路径？

ModelScope中apikey在哪申请？

dataset的版本问题导致与modelscope不兼容

ModelScope下载速度慢怎么解决？

怎么搭建本地文生图工作流

modelscope上跑报错，提示要pip install ttsfrd，搞不定

com/action/joingroup?code=v1是什么意思

ModelScope qwen7b、14b、72b lora微调分别需要的显存和cpu内存是多少？

如何下载modelscope模型？

展开全部

Z-Image：冲击体验上限的下一代图像生成模型

Qwen3-VL新成员 2B、32B来啦！更适合开发者体质

AgentScope：阿里开源多智能体低代码开发平台，支持一键导出源码、多种模型API和本地模型部署

Meta SAM3开源：让图像分割，听懂你的话

共学 | 2025年，更加有效地搭建Agent

MNN-LLM App：在手机上离线运行大模型，阿里巴巴开源基于 MNN-LLM 框架开发的手机 AI 助手应用

Z-Image Turbo LoRA训练魔法：如何保持加速生图能力

Agent Skills技术协议与开源实现，让大模型拥有“即插即用”技能

一文读懂“大语言模型”

智胜未来：国内大模型+Agent应用案例精选，以及主流Agent框架开源项目推荐

展开全部

还有其他疑问?