备案控制台

开发者社区 ModelScope模型即服务正文

ModelScope中，尝试模型介绍页面推荐的vllm启动命令，又出现报错，怎么解决？

" Qwen2-57B-A14B-Instruct 好像不太支持 modelscope server 启动服务，ModelScope中，尝试模型介绍页面推荐的vllm启动命令：python -m vllm.entrypoints.openai.api_server --served-model-name Qwen2-57B-A14B-Instruct --model /modelscope_cache/hub/qwen/Qwen2-57B-A14B-Instruct的，又出现报错，怎么解决？ [rank0]: torch.cuda.OutOfMemoryError: CUDA out of memory. Tried to allocate 2.19 GiB. GPU ，
"

展开

收起

小小爱吃香菜 2024-07-24 08:30:25 454 版权

1 条回答

写回答

取消提交回答

为了利利

爆显存了，可以加--gpu_memory_utilization和-max_model_len 此回答整理自钉群“魔搭ModelScope开发者联盟群 ①”

2024-07-24 16:27:07

赞同 1 展开评论

相关问答

obsidian插件Smart Composer添加modelscope的API后，执行报错

205

0

0

为什么modelscope模型库里面chinese-hubert-base 页面是错误，是模型下架吗

193

0

0

通过modelscope环境搭建LLama Factory使用 WebUI微调训练，访问页面报错

681

1

0

modelscope-funasr的Java客户端是怎么使用的啊，这个命令要在哪里执行呢？

461

0

0

在安装modelscope[nlp]的时候遇到报错怎么解决？

166

1

0

modelscope-funasr运行这个命令是报错，怎么解决？

172

0

0

ModelScope中示例页面的GPU版本和CPU版本。这两个不同版本会影响推理效率吗？

221

1

0

在modelscope-funasr中模型推理有报错，这个要怎么改？

128

0

0

ModelScope训练命令一开始就是 2048，怎么解决？

128

1

0

按照Q5操作了，然后运行本地模型报错，请问ModelScope是少了什么步骤吗？

138

1

0

ModelScope模型即服务

ModelScope旨在打造下一代开源的模型即服务共享平台，为泛AI开发者提供灵活、易用、低成本的一站式模型服务产品，让模型应用更简单！欢迎加入技术交流群：微信公众号：魔搭ModelScope社区，钉钉群号：44837352

我要提问

相关文章

如何保证Python采集淘商品详情数据的准确性？API接口系列

阿里云服务器多少钱一年？2025年12月最新价格38元、99元和199元配置详解

AI搜索引擎内容、GEO优化工具开发工程的“可信赖”基石：内容真实性、权威性与ADSM工程化闭环

支持"同款搜索"（精确匹配）和"相似搜索"（模糊匹配）两种模式

NPP 北方森林：加拿大卡纳尔弗拉茨，1984 年，R1

热门讨论

热门文章

我希望通过damo-YOLO训练1500*1500的图片

ModelScope中，模型下载默认路径在哪个路径？

ModelScope中apikey在哪申请？

dataset的版本问题导致与modelscope不兼容

ModelScope下载速度慢怎么解决？

com/action/joingroup?code=v1是什么意思

怎么搭建本地文生图工作流

关于 Windows平台上 ttsfrd 库的问题。

关于模型的下载，huggingface下载速度太慢，如何在modelscope快速下载？

ModelScope有部署qwen2-72b的么，正常推理需要多大的显存？

展开全部

中企投资印度新能源“有戏”吗？

Z-Image：冲击体验上限的下一代图像生成模型

Qwen3-VL新成员 2B、32B来啦！更适合开发者体质

AgentScope：阿里开源多智能体低代码开发平台，支持一键导出源码、多种模型API和本地模型部署

MNN-LLM App：在手机上离线运行大模型，阿里巴巴开源基于 MNN-LLM 框架开发的手机 AI 助手应用

智谱开源GLM-ASR：动动嘴，活就干了

Meta SAM3开源：让图像分割，听懂你的话

一文读懂“大语言模型”

智胜未来：国内大模型+Agent应用案例精选，以及主流Agent框架开源项目推荐

共学 | 2025年，更加有效地搭建Agent

展开全部

还有其他疑问?