备案控制台

开发者社区 ModelScope模型即服务计算机视觉正文

2.7B的gpt3，我在notebook里跑inference，报gpu显存不够，怎么办？

2.7B的gpt3，我在notebook里跑inference，报gpu显存不够，怎么办？

展开

收起

真的很搞笑 2023-03-22 15:47:50 532 版权

2 条回答

写回答

取消提交回答

哈哈是我

减少批量大小（Batch Size）：
减小批量大小可以减少每次推理过程中GPU的显存使用量。虽然这会导致推理速度降低，但能够有效降低显存需求。

使用混合精度（Mixed Precision）：
使用混合精度进行推理可以减少显存使用。这通常涉及到float32和float16数据类型的结合使用，而不是仅使用float32。

模型裁剪（Model Pruning）：
在不过分影响性能的情况下，通过裁剪掉模型中的一些参数（通常是权重较小的参数）来减小模型的大小。

检查并关闭其他GPU应用：
确保在运行模型之前关闭或减少其他GPU密集型应用程序的使用。

2024-02-23 16:40:17

赞同展开评论
凌云Cloud

发表文章、提出问题、分享经验、结交志同道合的朋友
如果你的GPU显存不够，你可以尝试以下几种方法：
- 减小batch size：你可以尝试减小输入的batch size，这样可以减少显存的使用。你可以尝试不同的batch size，找到一个最适合你的batch size。
- 减小模型大小：GPT-3是一个非常大的模型，如果你的显存不够，你可以尝试使用一个更小的模型，例如GPT-2或者BERT等。
2023-03-23 20:16:33

赞同展开评论

相关问答

DeepSeek 70B参数部署需要多少显存的GPU服务器，如何估算？

210

1

0

Qwen3 32B,14B,8B大模型部署分别需要多少显存，GPU服务器如何选？

2264

1

0

在modelscope-funasr我设4路的话，它的GPU显存占用就是4G吗？

100

1

0

FunASR离线文件转写服务GPU版本部署，这里的“每路分配1G显存”，在哪里设置呢？

195

0

0

如何选择一台94G显存的GPU服务器？

91

1

0

12GB以上显存对应的GPU服务器型号有什么？

237

1

0

modelscope-funasr的GPU推理的cpp版本内存和显存不回收的问题怎么解决？

132

0

0

ModelScope中官方有没有文档或者明确说明支持哪些GPU呢，显存是24G的?

106

1

0

想问一下ModelScope多卡部署后，使用了多张卡的显存。是使用多张卡的GPU进行推理吗？

195

1

0

请问qwen-72b-chat ModelScope模型本地部署推理需要多少GPU显存？

942

1

0

ModelScope模型即服务

计算机视觉

包含图像分类、图像生成、人体人脸识别、动作识别、目标分割、视频生成、卡通画、视觉评价、三维视觉等多个领域

我要提问

收录在圈子:

计算机视觉

171

+ 订阅

相关文章

Qwen3 Next 在 TensorRT LLM 上的部署指南

TensorRT LLM 中的并行策略

TensorRT-LLM 推理服务实战指南

阿里云新用户优惠：个人、学生和企业购买云服务器配置价格整理

2025年阿里云双十一优惠活动介绍：时间、入口、政策解读及优惠规则解析

热门讨论

热门文章

我希望通过damo-YOLO训练1500*1500的图片

ModelScope中，模型下载默认路径在哪个路径？

ModelScope中，大佬们4卡跑lora时，遇到这样的错，怎么解决？

ModelScope下载速度慢怎么解决？

如何下载modelscope模型？

cpu部署报错 Torch not compiled with CUDA enabled

在ModelScope中，下载模型时的ssl问题怎么解决？!

com/action/joingroup?code=v1是什么意思

服务器上onnxruntime-gpu 调用结束，如何释放显存

在ModelScope中，请问模型下载到本地的具体方法？

展开全部

Qwen2.5-VL：阿里通义千问最新开源视觉语言模型，能够理解超过1小时的长视频

RF-DETR：YOLO霸主地位不保？开源 SOTA 实时目标检测模型，比眨眼还快3倍！

X-AnyLabeling：开源的 AI 图像标注工具，支持多种标注样式，适于目标检测、图像分割等不同场景

SPAR3D：一张图片就能生成3D模型，每个物体的重建时间仅需0.7秒！

JoyCaption：开源的图像转提示词生成工具，支持多种风格和场景，性能与 GPT4o 相当

video-analyzer：开源视频分析工具，支持提取视频关键帧、音频转录，自动生成视频详细描述

InvSR：开源图像超分辨率生成模型，提升分辨率，修复老旧照片为超清图像

Manga Image Translator：开源的漫画文字翻译工具，支持多语言翻译并嵌入原图，保持漫画的原始风格和布局

PSHuman：开源单图像3D人像重建技术，一张照片就能生成3D人像模型

STAR：南京大学联合字节开源视频超分辨率增强生成框架，视频清晰度一键提升，支持从低分辨率视频生成高分辨率视频

展开全部

还有其他疑问?