备案控制台

开发者社区 ModelScope模型即服务正文

部署通义72B遇到的问题

各位大佬帮看下这个怎么配置，在启动demo72B的提示显存不足，我的配置是两张A5000,总共48G的显存，下载的模型也是int4的
报错信息：torch.cuda.OutOfMemoryError: CUDA out of memory. Tried to allocate 2.32 GiB. GPU 1 has a total capacty of 23.68 GiB of which 2.25 GiB is free. Including non-PyTorch memory, this process has 21.42 GiB memory in use. Of the allocated memory 21.13 GiB is allocated by PyTorch, and 98.39 MiB is reserved by PyTorch but unallocated. If reserved but unallocated memory is large try setting max_split_size_mb to avoid fragmentation. See documentation for Memory Management and PYTORCH_CUDA_ALLOC_CONF

展开

收起

r2lf7cgrddr6c 2024-01-10 10:04:04 598 版权

1 条回答

写回答

取消提交回答

小周sir

面对过去，不要迷离；面对未来，不必彷徨；活在今天，你只要把自己完全展示给别人看。
根据您的描述，您的显存不足导致无法启动demo72B。您可以尝试以下方法来解决这个问题：
1. 减小模型的批量大小（batch size）。这将减少每次迭代中所需的显存。在PyTorch中，您可以在训练循环中设置batch_size参数。例如：
```
train_loader = torch.utils.data.DataLoader(train_dataset, batch_size=32, shuffle=True)
```
1. 使用梯度累积（gradient accumulation）。这意味着您将多个小批量（mini-batch）的梯度累加到一个更大的批次上，然后一次性更新模型参数。这可以有效地减少显存需求。例如：
```
accumulation_steps = 4
optimizer.zero_grad()
for i, (inputs, labels) in enumerate(train_loader):
    outputs = model(inputs)
    loss = criterion(outputs, labels)
    loss.backward()
    if (i + 1) % accumulation_steps == 0:
        optimizer.step()
        optimizer.zero_grad()
```
1. 检查是否有其他进程占用了大量显存。您可以使用nvidia-smi命令查看GPU内存使用情况。如果有其他进程占用了大量显存，您可以考虑关闭它们或者增加系统可用显存。
2. 如果以上方法都无法解决问题，您可以考虑使用具有更多显存的GPU，或者升级您的硬件配置。
2024-01-13 17:48:20

赞同展开评论

相关问答

通过www和不带www的网址输入最终都指向www.我的域名.com，求指教

130792

28

0

请问下我访问接口不通什么原因 Provisional headers are shown

2771

0

0

购买阿里国外的云服务器是否可以访问谷歌？

82067

47

0

手机弹出支付风险问题

6817

2

0

this xml file does not appear to have any style in

50561

10

0

计算机网络的频带传输是什么意思？

1997

1

0

OSS的endpoint如何查看

36917

6

0

sql server的用户名和密码怎么查啊？

36549

21

0

域名在腾讯云备案成功，解析到阿里云服务器，提示仍需备案？

60171

30

0

配置了安全组规则，端口还是无法访问

32833

25

0

ModelScope模型即服务

ModelScope旨在打造下一代开源的模型即服务共享平台，为泛AI开发者提供灵活、易用、低成本的一站式模型服务产品，让模型应用更简单！欢迎加入技术交流群：微信公众号：魔搭ModelScope社区，钉钉群号：44837352

我要提问

相关文章

手把手教你用 Ollama 在本地部署大模型：无需 GPU，10 分钟跑通 Llama 3！

阿里云新用户优惠：个人、学生和企业购买云服务器配置价格整理

2025年阿里云双十一优惠活动介绍：时间、入口、政策解读及优惠规则解析

创新型调制方案——剪枝DFT扩展FBMC结合SC-FDMA优势研究（Matlab代码实现）

《从零散到闭环：Unity工具链协同的高效搭建方案》

热门讨论

热门文章

如何训练属于自己的AI大模型呢？有没有大佬有相关文档参考学习下

dataset的版本问题导致与modelscope不兼容

qwen3-32b和qwen-2.5-32b-Instruct有什么区别

ModelScope中，模型下载默认路径在哪个路径？

我希望通过damo-YOLO训练1500*1500的图片

ModelScope中，大佬们4卡跑lora时，遇到这样的错，怎么解决？

从modelscope下载模型失败，怎么回事？

com/action/joingroup?code=v1是什么意思

modelscope-funasr模型选择whisper large v3，不出时间戳是正常的吗？

ModelScope下载速度慢怎么解决？

展开全部

万字长文深度解析最新Deep Research技术：前沿架构、核心技术与未来展望

Qwen3-VL新成员 2B、32B来啦！更适合开发者体质

MiniMax-M2 发布！10B激活，专为高效编码与Agent工作流而生

Qwen3-VL再添丁！4B/8B Dense模型开源，更轻量，仍强大

MNN-LLM App：在手机上离线运行大模型，阿里巴巴开源基于 MNN-LLM 框架开发的手机 AI 助手应用

仅100多元，他给视障人群装上AI“眼睛”

AgentScope：阿里开源多智能体低代码开发平台，支持一键导出源码、多种模型API和本地模型部署

美团 LongCat-Video 视频生成模型正式发布，探索世界模型的第一步

智胜未来：国内大模型+Agent应用案例精选，以及主流Agent框架开源项目推荐

Dolphin：40语种+22方言！清华联合海天瑞声推出的语音识别大模型，识别精度超Whisper两代

展开全部

还有其他疑问?