文档备案控制台

开发者社区 ModelScope模型即服务正文

ModelScope中，有10张v100的卡，其中前两张被占用，但是报错，请问咋解决？

"ModelScope中，有10张v100的卡，其中前两张被占用，我只能用后面8张卡。我写了代码# 设置 CUDA_VISIBLE_DEVICES 环境变量
os.environ['CUDA_VISIBLE_DEVICES'] = '2,3,4,5,6,7,8,9'

启动 vLLM API 服务器

server_process = subprocess.Popen([
'python', '-m', 'vllm.entrypoints.openai.api_server',
'--model', './qwen/Qwen2-72B-Instruct',
'--dtype=half',
'--tensor-parallel-size=8'
]) 但是报错，请问咋解决？ torch.cuda.OutOfMemoryError: CUDA out of memory. Tried to allocate 232.00 MiB. GPU 0 has a total capacty of 31.74 GiB of which 215.12 MiB is free. Including non-PyTorch memory, this process has 30.24 GiB memory in use. Process 269595 has 436.00 MiB memory in use. Process 269513 has 436.00 MiB memory in use. Process 269211 has 436.00 MiB memory in use. Of the allocated memory 29.78 GiB is allocated by PyTorch, and 13.43 MiB is reserved by PyTorch but unallocated. If reserved but unallocated memory is large try setting max_split_size_mb to avoid fragmentation. See documentation for Memory Management and PYTORCH_CUDA_ALLOC_CONF "

展开

收起

小小爱吃香菜 2024-07-17 08:18:02 281 版权

1 条回答

写回答

取消提交回答

为了利利

参考以下链接
https://github.com/modelscope/swift/blob/main/docs/source/LLM/VLLM%E6%8E%A8%E7%90%86%E5%8A%A0%E9%80%9F%E4%B8%8E%E9%83%A8%E7%BD%B2.md
此回答整理自钉群“魔搭ModelScope开发者联盟群 ①”

2024-07-17 12:48:27

赞同 7 展开评论

相关问答

ModelScope镜像拉取报错，怎么处理？

247

1

0

ModelScope中，notebook无法启动报错信息err 怎么处理啊？

202

0

0

ModelScope训练报错如下，是什么原因？

170

1

0

modelscope-funasr这个报错怎么解决？

184

1

0

ModelScope利用Api调用的时候报错503 ，怎么解决？

305

1

0

Make-A-Character 项目一直不能访问，这个是ModelScope的什么问题？

153

1

0

ModelScope中使用开源的千问1_8预训练模型微调后测试模型的时候报错，怎么解决？

465

0

0

文件报错，ModelScope中有没有办法进行规避？

140

0

0

已经按照上面的先卸载，再重新安装。modelscope安装成功了，启动服务时还是报错了？

143

0

0

ModelScope中，发现V100能跑起来，A100还是会hang住不动了，怎么解决？

238

0

0

ModelScope模型即服务

ModelScope旨在打造下一代开源的模型即服务共享平台，为泛AI开发者提供灵活、易用、低成本的一站式模型服务产品，让模型应用更简单！欢迎加入技术交流群：微信公众号：魔搭ModelScope社区，钉钉答疑群：44837352

我要提问

相关文章

GLM-5.2:长任务时代开源旗舰模型——阿里云百炼平台技术解决方案

在阿里云ECS云服务器上搭建 OpenClaw 并集成百炼Token Plan教程与问题排查

百炼 MCP 市场实战，一句话查 A 股全市场数据

Hermes Agent在阿里云ECS的部署与百炼Token Plan配置实操手册

热门讨论

热门文章

ModelScope中，模型下载默认路径在哪个路径？

在ModelScope中，这个下载文件是模型文件吗？存储路径能改吗？

下载ModelScope模型默认放在哪个目录下啊，可以指定目录吗？

ModelScope中，灵积模型服务怎么看账单比如如何看我的免费token额度还剩下多少?

modelscope-funasr的onnxruntime c++只能使用onnx结尾的模型吗？

com/action/joingroup?code=v1是什么意思

cuda 是11.3，ModelScope的mmcv怎么安装？

ModelScope下载速度慢怎么解决？

ModelScope镜像地址是什么？

IndexTTS 部署报错：No module named 'tn'

展开全部

中企投资印度新能源“有戏”吗？

高效部署通义万相Wan2.1：ComfyUI文生/图生视频实战，工作流直取！

在魔搭使用ComfyUI，玩转AIGC

Multi-Agent实践第5期：RAG智能体的应用：让AgentScope介绍一下自己吧

嵌入式开发必备！Keil uVision5 C51 V9.61 安装激活 + 汉化完整教程, 含（Keil MDK 5.39）

Qwen1.5-MoE开源，魔搭社区推理训练最佳实践教程来啦

手把手教你捏一个自己的Agent

GLM-4V-Flash：智谱 AI 免费开放的图像理解大模型 API 接口

零一万物开源Yi系列“理科状元”Yi-9B，消费级显卡可跑，魔搭社区最佳实践

Hermes Agent：深度技术剖析报告

展开全部

还有其他疑问?