文档备案控制台

开发者社区阿里云百炼正文

【QWEN-VL-2.5版本】本地部署，视频理解任务时报错：out of memory

各位专家好，
本地部署了Qwen2.5-VL-7B-Instruct，做视频理解，上传了一个34MB大小的视频。
问题是：这个视频显示了一个交通路口，画面存在抖动"\nAssistant:"

   本地部署报错信息如下：torch.OutOfMemoryError: CUDA out of memory. Tried to allocate 40.80 GiB. GPU 0 has a total capacity of 79.15 GiB of which 15.61 GiB is free. Including non-PyTorch memory, this process has 63.54 GiB memory in use. Of the allocated memory 23.85 GiB is allocated by PyTorch, and 39.20 GiB is reserved by PyTorch but unallocated. If reserved but unallocated memory is large try setting PYTORCH_CUDA_ALLOC_CONF=expandable_segments:True to avoid fragmentation.  See documentation for Memory Management  (https://pytorch.org/docs/stable/notes/cuda.html#environment-variables)

我本机的部署是：
双A100机器，显存80GB*2

按照报错信息，我阐释了设置PYTORCH_CUDA_ALLOC_CONF=expandable_segments
结果直接起模型直接core dump。

展开

收起

游客ia3mrqiyudej2 2025-06-24 19:13:08 713 版权

版权声明：本文内容由阿里云实名注册用户自发贡献，版权归原作者所有，阿里云开发者社区不拥有其著作权，亦不承担相应法律责任。具体规则请查看《阿里云开发者社区用户服务协议》和《阿里云开发者社区知识产权保护指引》。如果您发现本社区中有涉嫌抄袭的内容，填写侵权投诉表单进行举报，一经查实，本社区将立刻删除涉嫌侵权内容。

0 条回答

写回答

取消提交回答

问答分类：

算法框架/工具 PyTorch 并行计算异构计算大模型服务平台百炼

问答地址：

开发者社区 > 阿里云百炼 > 问答

相关问答

百炼平台2.0的智能体应用开发，如何实现一个大模型任务节点内，通过多轮对话收集完信息后再到下一步

382

2

0

阿里云语音AI在使用 cosyvoice大模型TTS任务时，发现总是报错40000004，咋回事？

470

1

0

Qwen-Audio在多任务预训练中取得了哪些显著成果？

153

1

0

Qwen-Audio如何克服多任务预训练中的干扰问题？

170

1

0

ModelScope可以和物联网结合，告诉大模型任务，调用阿里通iot的api完成吗？

222

0

0

ModelScope的Qwen-1_8B-Chat使用Lora微调实现不了开放式的分类任务吗？

304

1

0

通义千问：pipeline 任务支持visual_grounding功能吗？

432

0

0

在4卡4090（24G）服务器上利用modelscope离线部署Qwen2vl-Flux时报错

520

1

0

modelscope中，为什么用结构的数据集训练qwen-7b-chat后没效果呢？

265

1

0

modelscope微调qwen57b 遇到的问题，为啥显示张量大小不一样？

235

1

0

阿里云百炼

基于千问系列大模型和开源大模型的一站式大模型服务平台，提供「生成式大模型的全流程应用工具」和「企业大模型的全链路训练工具」。为大模型，也为小应用。阿里云百炼产品介绍页面：https://www.aliyun.com/product/bailian

我要提问

相关文章

聚搜云服务器专业团队：PAI-DSW 怎么配置，才能顺畅运行开源大模型？

聚搜云运维团队：PAI大模型推理吞吐量优化，批处理、KV Cache与实战指南

重磅！阿里云真武 M890 超节点 Day0 适配 Kimi K3，国产算力支撑近 3 万亿参数大模型

社区之声：一次 Agent 协作“翻车”，让我看懂了 RocketMQ 这次升级

揭秘大模型通用8192维度奥秘：千亿大模型为何统一采用8192隐层维度的真相.183

相关解决方案

更多

快速部署DeepSeek-OCR

一键生成PPT及讲解视频

GLM-5.2：长任务时代开源旗舰模型

一键部署幻兽帕鲁游戏服务器

OpenAI 重磅开源，快速部署GPT-OSS模型

热门讨论

热门文章

在阿里云OpenAPI调用通义千问报错怎么办？

免费用户的token还没开始用就报错

关于Invalid API-key provided问题

DeepSeek API 调用没反应，超时后报错 500，这是啥意思，按照对接文档调用的啊

消息格式会显著影响模型的reasoning行为

Kimi-K2-Instruct 开了挂一般的推理和调用，底层魔法是什么？

模型免费

阿里云的轻量服务器部署的openclaw是2026.2.26的版本，该怎么更新呢？

我需要一台服务器用于部署Docker，用来安装Dify，推荐什么服务器？

AI陪练 VS 真人教学，你更喜欢哪一个？

展开全部

如何防止量子计算暴力解密？中国启动新型算法研究

如何查看Oracle客户端版本

从零搭建企业私有知识库：RAG + 大模型实战（附完整代码）

阿里云百炼平台详解：官网入口链接、免费AI大模型领取及常见问题解答FAQ

阿里云百炼 API 调用教程：准备 API-Key、配置环境变量和调用 API 流程

阿里云AI产品免费试用活动：超30款AI产品免费试用，开通百炼享1亿+大模型 tokens 限免体验

阿里云Qwen3.7-Max接入百炼大模型服务流程：API 调用、Token Plan订阅两种接入方式流程参考

打造你的赛博女友/男友 —— AstrBot 完全指南

自研 AOQ 协议，为多模态 AI 构建确定性传输底座

短剧 / 广告量产神器！万镜一刻 yikeai 搭载 HappyHorse1.1，故事板 + 无限画布打通全链路 AI 视频生产

展开全部

还有其他疑问?