备案控制台

开发者社区 ModelScope模型即服务正文

ModelScope中，尝试模型介绍页面推荐的vllm启动命令，又出现报错，怎么解决？

" Qwen2-57B-A14B-Instruct 好像不太支持 modelscope server 启动服务，ModelScope中，尝试模型介绍页面推荐的vllm启动命令：python -m vllm.entrypoints.openai.api_server --served-model-name Qwen2-57B-A14B-Instruct --model /modelscope_cache/hub/qwen/Qwen2-57B-A14B-Instruct的，又出现报错，怎么解决？ [rank0]: torch.cuda.OutOfMemoryError: CUDA out of memory. Tried to allocate 2.19 GiB. GPU ，
"

展开

收起

小小爱吃香菜 2024-07-24 08:30:25 414 版权

1 条回答

写回答

取消提交回答

为了利利

爆显存了，可以加--gpu_memory_utilization和-max_model_len 此回答整理自钉群“魔搭ModelScope开发者联盟群 ①”

2024-07-24 16:27:07

赞同 1 展开评论

相关问答

为什么modelscope模型库里面chinese-hubert-base 页面是错误，是模型下架吗

110

0

0

llamaindex整合modelscope本地模型，启动报错

460

1

0

通过modelscope环境搭建LLama Factory使用 WebUI微调训练，访问页面报错

610

1

0

modelscope-funasr的Java客户端是怎么使用的啊，这个命令要在哪里执行呢？

433

0

0

想请问下ModelScope里Vllm部署了qwen1.5-32B之后，它无限输出日志怎么解决？

398

0

0

modelscope这个报错呢怎么回事？在参数里加上encoding=utf-8，又会出现这个报错

122

1

0

modelscope-funasr运行这个命令是报错，怎么解决？

148

0

0

modelscope-funasr执行sencevoice后报错怎么解决？

114

0

0

modelscope-funasr这个报错是什么问题？

91

1

0

modelscope里用vllm调用千问1.5-7b流式输出，没输出完就结束了，有限制输出多少字吗?

194

1

0

ModelScope模型即服务

ModelScope旨在打造下一代开源的模型即服务共享平台，为泛AI开发者提供灵活、易用、低成本的一站式模型服务产品，让模型应用更简单！欢迎加入技术交流群：微信公众号：魔搭ModelScope社区，钉钉群号：44837352

我要提问

相关文章

MATLAB R2024b 数据分析软件，安装详细步骤，附安装包

Python编程基础: 列表常见操作方法总结

Python编程实战 - 面向对象与进阶语法 - 继承与多态

阿里云服务器最新租用价格解析：包年包月和按量收费标准，活动价格与选购攻略参考

1688 API接口的应用场景介绍

热门讨论

热门文章

如何训练属于自己的AI大模型呢？有没有大佬有相关文档参考学习下

dataset的版本问题导致与modelscope不兼容

qwen3-32b和qwen-2.5-32b-Instruct有什么区别

ModelScope中，模型下载默认路径在哪个路径？

我希望通过damo-YOLO训练1500*1500的图片

ModelScope中，大佬们4卡跑lora时，遇到这样的错，怎么解决？

从modelscope下载模型失败，怎么回事？

com/action/joingroup?code=v1是什么意思

ModelScope下载速度慢怎么解决？

modelscope-funasr模型选择whisper large v3，不出时间戳是正常的吗？

展开全部

万字长文深度解析最新Deep Research技术：前沿架构、核心技术与未来展望

Qwen3-VL新成员 2B、32B来啦！更适合开发者体质

Qwen3-VL再添丁！4B/8B Dense模型开源，更轻量，仍强大

MNN-LLM App：在手机上离线运行大模型，阿里巴巴开源基于 MNN-LLM 框架开发的手机 AI 助手应用

美团 LongCat-Video 视频生成模型正式发布，探索世界模型的第一步

AgentScope：阿里开源多智能体低代码开发平台，支持一键导出源码、多种模型API和本地模型部署

仅100多元，他给视障人群装上AI“眼睛”

智胜未来：国内大模型+Agent应用案例精选，以及主流Agent框架开源项目推荐

Dolphin：40语种+22方言！清华联合海天瑞声推出的语音识别大模型，识别精度超Whisper两代

全新框架 Glyph 开源：用视觉理解文本，3–4 倍上下文压缩，近 5 倍推理提速！

展开全部

还有其他疑问?