备案控制台

开发者社区 > ModelScope模型即服务 > 计算机视觉 > 正文

ModelScope跑了一下7b前两个问题可以回答，怎么回答后GPU的占用没降下去，再问就爆显存了？

ModelScope跑了一下7b前两个问题可以回答，怎么回答后GPU的占用没降下去，再问就爆显存了？

展开

收起

青城山下庄文杰 2023-08-06 08:48:05 305 0

2 条回答

写回答

取消提交回答

Ð

把模型实例化那部分拆开来，只执行一次。重复执行会爆显存。-此回答整理自钉群“魔搭ModelScope开发者联盟群 ①”

2023-08-08 10:47:28

赞同展开评论打赏
算精通

北京阿里云ACE会长

如果在使用ModelScope运行7b模型后，回答了前两个问题后GPU的占用没有降下去，并且继续提问可能导致显存耗尽，可能有以下原因和解决方法：

内存泄漏：可能存在内存泄漏导致GPU显存无法正确释放。内存泄漏可能是由于代码中的bug或资源管理问题引起的。您可以检查代码并确保在每个问题回答后释放不再需要的资源，特别是模型和中间计算结果。

模型加载：如果在每次提问时都重新加载模型，这会导致GPU显存占用较高。您可以尝试将模型加载操作移至整个问答过程的开始，而不是每次提问时都重新加载。

批处理大小：如果批处理大小设置过大，可能会导致显存耗尽。您可以尝试减小批处理大小，以降低对显存的需求。

显存清理：在每次回答问题后，您可以手动清理GPU显存。您可以使用相关的深度学习框架提供的函数或方法，如TensorFlow的tf.keras.backend.clear_session()或PyTorch的torch.cuda.empty_cache()，来清理GPU显存。

限制提问频率：如果显存耗尽问题仍然存在，您可以限制提问的频率，确保每次提问之间有足够的时间来释放GPU显存。这可以通过添加适当的延迟或等待时间来实现。

请注意，上述解决方法是一般性的建议，具体操作可能取决于您使用的代码和框架。您需要仔细检查代码，了解模型加载和资源管理的细节，并根据具体情况进行调整。

2023-08-07 20:10:01

赞同展开评论打赏

相关问答

modelscope-funasr怎么设置使得模型可以用CUDA0以外的其他gpu？

49

1

0

modelscope-funasr服务端部署的话，推荐什么样的GPU？

24

0

0

ModelScope 报显存不够如下图怎么解决？

49

1

0

modelscope-funasr的GPU调用失败了，是什么原因？

26

0

0

modelscope-funasr的GPU离线转写服务的说话人识别模块要怎么配置啊？

36

0

0

modelscope-funasr能支持用gpu来做实时转写吗？

27

0

0

modelscope-funasr最新的gpu高吞吐服务用的模型和原来cpu的参数量是一样的么？

24

0

0

modelscope-funasr一键部署的支持sensevoice模型了吗？

23

0

0

ModelScope中.我下载到本地的模型，分析执行时间好像有点长，有办法提高效率吗？

25

1

0

ModelScope的模型里面也没看见有关sequence_length的参数，怎么解决？

24

1

0

ModelScope模型即服务

计算机视觉

包含图像分类、图像生成、人体人脸识别、动作识别、目标分割、视频生成、卡通画、视觉评价、三维视觉等多个领域

我要提问

热门讨论

热门文章

ModelScope中，模型下载默认路径在哪个路径？

com/action/joingroup?code=v1是什么意思

请问在 ModelScope 上的模型断网使用报这个错误啥原因了?

服务器上onnxruntime-gpu 调用结束，如何释放显存

我希望通过damo-YOLO训练1500*1500的图片

ModelScope中，大佬们4卡跑lora时，遇到这样的错，怎么解决？

如何下载modelscope模型？

ModelScope 使用14B模型推理时报这个错误？

streamlit 生成链接无法访问，gradio只生成内网，无法生成公网

请问modelscope中，有一个依赖，kantts，要怎么安装？

展开全部

YOLOv10实战：SPPF原创自研 | SPPF_attention，重新设计加入注意力机制 | NEU-DET为案列进行展开

YOLOv10实战：红外小目标实战 | 多头检测器提升小目标检测精度

关于flux.1 loras的8个问题

关键点检测从入门到进阶

一种基于YOLOv8改进的高精度红外小目标检测算法（原创自研）

Stable Diffusion 介绍与入门

达摩院OpenVI-视频目标跟踪ICASSP 2023 Oral 渐进式上下文Transformer跟踪器 ProContEXT

ModelScope模型使用与EAS部署调用

展开全部

相关课程

更多

云原生AI套件：一键训练大模型及部署GPU共享推理服务

65

1

去学习

个性化语音合成模型微调

248

1

去学习

ModelScope社区Library技术架构介绍

225

1

去学习

相关电子书

更多

DeepStream: GPU加速海量视频数据智能处理 立即下载

阿里巴巴高性能GPU架构与应用 立即下载

GPU在超大规模深度学习中的发展和应用 立即下载

相关实验场景

更多