各位专家好,
本地部署了Qwen2.5-VL-7B-Instruct,做视频理解,上传了一个34MB大小的视频。
问题是:这个视频显示了一个交通路口,画面存在抖动"\nAssistant:"
本地部署报错信息如下:torch.OutOfMemoryError: CUDA out of memory. Tried to allocate 40.80 GiB. GPU 0 has a total capacity of 79.15 GiB of which 15.61 GiB is free. Including non-PyTorch memory, this process has 63.54 GiB memory in use. Of the allocated memory 23.85 GiB is allocated by PyTorch, and 39.20 GiB is reserved by PyTorch but unallocated. If reserved but unallocated memory is large try setting PYTORCH_CUDA_ALLOC_CONF=expandable_segments:True to avoid fragmentation. See documentation for Memory Management (https://pytorch.org/docs/stable/notes/cuda.html#environment-variables)
我本机的部署是:
双A100机器,显存80GB*2
按照报错信息,我阐释了设置PYTORCH_CUDA_ALLOC_CONF=expandable_segments
结果直接起模型直接core dump。
版权声明:本文内容由阿里云实名注册用户自发贡献,版权归原作者所有,阿里云开发者社区不拥有其著作权,亦不承担相应法律责任。具体规则请查看《阿里云开发者社区用户服务协议》和《阿里云开发者社区知识产权保护指引》。如果您发现本社区中有涉嫌抄袭的内容,填写侵权投诉表单进行举报,一经查实,本社区将立刻删除涉嫌侵权内容。
基于通义系列大模型和开源大模型的一站式大模型服务平台,提供「生成式大模型的全流程应用工具」和「企业大模型的全链路训练工具」。为大模型,也为小应用。 阿里云百炼官网网址:https://www.aliyun.com/product/bailian