文档备案控制台

开发者社区 ModelScope模型即服务正文

ModelScope的11g显存跑千问1.5-1.8怎么也够了，为什么还报错?

"ModelScope的11g显存跑千问1.5-1.8怎么也够了，为什么还报错? torch.empty(kv_cache_shape,
torch.cuda.OutOfMemoryError: CUDA out of memory. Tried to allocate 252.00 MiB. GPU 0 has a total capacty of 10.75 GiB of which 231.94 MiB is free. Including non-PyTorch memory, this process has 9.54 GiB memory in use. Of the allocated memory 9.13 GiB is allocated by PyTorch, and 69.40 MiB is reserved by PyTorch but unallocated. If reserved but unallocated memory is large try setting max_split_size_mb to avoid fragmentation. See documentation for Memory Management and PYTORCH_CUDA_ALLOC_CONF 可复现的代码 #!/bin/bash

Command to run the VLLM OpenAI API server

python3 -m vllm.entrypoints.openai.api_server \
--model=/home/Qwen1.5-7b-chat/Qwen1.5-1.8B \
--served-model-name=Qwen1.5 \
--dtype=half \
--tensor-parallel-size=1 \
--trust-remote-code \
--gpu-memory-utilization=0.90 \
--host=0.0.0.0 \
--port=8001 \
--max-model-len=500 \
--max-num-seqs=1"

展开

收起

小小爱吃香菜 2024-05-01 08:57:32 283 版权

1 条回答

写回答

取消提交回答

为了利利

参考以下代码 VLLM_USE_MODELSCOPE=True python -m vllm.entrypoints.openai.api_server --model="qwen/Qwen1.5-1.8B-Chat" --revision="master" 内存分的多了不稳定改成0.75就好了。此回答整理自钉群“魔搭ModelScope开发者联盟群 ①”

2024-05-01 16:00:15

赞同 1 展开评论

相关问答

ModelScope 报显存不够如下图怎么解决？

372

1

0

modelscope-funasr的paraformer推理的显存是有什么决定的，为啥会不太稳定？

305

1

0

在modelscope-funasr当音频文件超过一个小时后，显存溢出怎么解决？

287

1

0

用Python加gradio参考示例代码制作了调用千问的应用在modelscope上应该怎样运行呢？

195

1

0

modelscope里用vllm调用千问1.5-7b流式输出，没输出完就结束了，有限制输出多少字吗?

259

1

0

ModelScope报错怎么解决？

215

1

0

想下载分词示例中的ModelScope模型，执行download命令为什么报错模型不存在呢？

358

1

0

ModelScope有没有对各种大模型使用各种微调方法所需要显存的统计？

195

1

0

ModelScope中，在web页面部署的时候提示GBK报错，怎么解决？

106

1

0

modelscope推理报错 swift infer 是啥问题呢？

251

1

0

ModelScope模型即服务

ModelScope旨在打造下一代开源的模型即服务共享平台，为泛AI开发者提供灵活、易用、低成本的一站式模型服务产品，让模型应用更简单！欢迎加入技术交流群：微信公众号：魔搭ModelScope社区，钉钉答疑群：44837352

我要提问

相关文章

VMware Aria Operations 8.18.6 - 多云 IT 运维管理

让 AI Agent 过目不忘：无影 AgentBay 跨会话数据持久化实战

基于WHOIS数据的域名续费钓鱼攻击机理与防御

手把手教你用阿里云服务器+百炼Coding Plan搭建OpenClaw智能助手

AI开源知识库｜新手友好版部署教程+真实使用心得

相关解决方案

更多

千问3 + MCP：一切皆有可能

千问与 LangChain 搭建对话服务

向量检索与千问搭建专属问答服务

AnalyticDB 与千问搭建 AI 客服

千问+Vanna：让数据库听懂人话

热门讨论

热门文章

部署coclaw，报错如下，怎么办？应该点击哪里？

copaw安装后，出现这个情况，在设置模型的过程中出现这个问题，如何解决

Swingdeploy搜索不到已有模型

云端部署coclaw报错

copaw安装后选择ollma为啥报错不能安装相关模型？

ModelScope中，模型下载默认路径在哪个路径？

已经实名，但免费API无法使用

运行qwen-image显示Reconnecting

com/action/joingroup?code=v1是什么意思

CoPAW配置后，对话，出现 AGENT_UNKNOWN_ERROR 如何解决

展开全部

OpenClaw（原 Clawdbot）钉钉对接保姆级教程手把手教你打造自己的 AI 助手

Qwen3.5 中等规模模型系列正式开源：更强智能，更低算力

保姆级 OpenClaw （原 Clawdbot）飞书对接教程手把手教你搭建 AI 助手

Qwen3.5：迈向原生多模态智能体

MiniMax M2.5 开源，低成本Agent时代来了！社区Day0部署、工具调用、推理&提示词参数实战来啦！

GLM-5开源：迈向Agentic Engineering新范式，社区Day0 部署、推理实战来了！

魔搭社区+OpenVINO™ 加速部署 Qwen3-ASR 实战

MNN-LLM App：在手机上离线运行大模型，阿里巴巴开源基于 MNN-LLM 框架开发的手机 AI 助手应用

HTTPS 原理

AgentScope：阿里开源多智能体低代码开发平台，支持一键导出源码、多种模型API和本地模型部署

展开全部

还有其他疑问?