文档备案控制台

开发者社区 ModelScope模型即服务正文

ModelScope中运行7B模型，报错：[rank0]: ,怎么解决？

python -m vllm.entrypoints.openai.api_server --served-model-name Qwen2-7B-Instruct --model /modelscope_cache/hub/qwen/ModelScope中Qwen2-7B-Instruct ，运行7B模型，报错：[rank0]: ,怎么解决？ torch.cuda.OutOfMemoryError: CUDA out of memory. Tried to allocate 1.16 GiB. GPU ，

展开

收起

小小爱吃香菜 2024-07-24 08:25:14 317 版权

1 条回答

写回答

取消提交回答

为了利利

python -m vllm.entrypoints.openai.api_server --served-model-name Qwen2-7B-Instruct --model /modelscope_cache/hub/qwen/Qwen2-7B-Instruct --dtype half --max_model_len 8192 看下显存够的话，max_model_len可以大一些。此回答整理自钉群“魔搭ModelScope开发者联盟群 ①”

2024-07-24 16:32:15

赞同 2 展开评论

相关问答

modelscope官方docker镜像下载后在windows下如何运行

1303

2

0

modelscope-funasr运行这个命令是报错，怎么解决？

321

0

0

modelscope-funasr的sensevoice运行api时报的这个错该怎么解决？

471

1

0

ModelScope 用git 复制并上传一个已有的空间，可以发布。运行后出现以下问题，怎么处理？

274

1

0

ModelScope创空间成功运行了，如何上传文档让其学习知识库？

238

1

0

ModelScope镜像拉取报错，怎么处理？

252

1

0

ModelScope中，notebook无法启动报错信息err 怎么处理啊？

205

0

0

modelscope-funasr运行官方示例代码还是报错了，怎么解决？

219

1

0

modelscope-funasr运行这个例子程序卡住了什么原因？

285

1

0

ModelScope训练报错如下，是什么原因？

173

1

0

ModelScope模型即服务

ModelScope旨在打造下一代开源的模型即服务共享平台，为泛AI开发者提供灵活、易用、低成本的一站式模型服务产品，让模型应用更简单！欢迎加入技术交流群：微信公众号：魔搭ModelScope社区，钉钉答疑群：44837352

我要提问

相关文章

用 Playwright MCP 和 Ollama 搭一个更稳的浏览器自动化 Agent

不抄代码只抄脑子：照着 SmartCrusher 给我那个 SRE agent 写了个压缩中间件

OpenCode 部署本地模型完整流程：Ollama搭建离线编程AI保姆级实操

相关解决方案

更多

GLM-5.2：长任务时代开源旗舰模型

模型蒸馏：让0.6B模型媲美235B模型

OpenAI 重磅开源，快速部署GPT-OSS模型

基于 Spark 和 PyTorch 的模型训练方案

一键训练模型及部署GPU共享推理服务

热门讨论

热门文章

ModelScope中，模型下载默认路径在哪个路径？

ModelScope下载速度慢怎么解决？

modelscope-funasr的onnxruntime c++只能使用onnx结尾的模型吗？

com/action/joingroup?code=v1是什么意思

cuda 是11.3，ModelScope的mmcv怎么安装？

ModelScope中，灵积模型服务怎么看账单比如如何看我的免费token额度还剩下多少?

IndexTTS 部署报错：No module named 'tn'

ModelScope镜像地址是什么？

ModelScope这个免费额度可以在哪里查询啊？

qwen3-32b和qwen-2.5-32b-Instruct有什么区别

展开全部

中企投资印度新能源“有戏”吗？

高效部署通义万相Wan2.1：ComfyUI文生/图生视频实战，工作流直取！

嵌入式开发必备！Keil uVision5 C51 V9.61 安装激活 + 汉化完整教程, 含（Keil MDK 5.39）

GLM-4V-Flash：智谱 AI 免费开放的图像理解大模型 API 接口

MNN-LLM App：在手机上离线运行大模型，阿里巴巴开源基于 MNN-LLM 框架开发的手机 AI 助手应用

DeepSeek-V4开源：百万上下文，Agent能力比肩顶级闭源模型

阿里开源AI视频生成大模型 Wan2.1：14B性能超越Sora、Luma等模型，一键生成复杂运动视频

Hermes Agent：深度技术剖析报告

Seedance vs Sora vs Kling：AI 视频生成模型深度对比

AgentScope 2.0 发布：从"跑通 Demo"到"稳定落地"，构建可靠智能体的工程底座

展开全部

还有其他疑问?