备案控制台

开发者社区 ModelScope模型即服务计算机视觉正文

ModelScope 24G的显存，没有一个大模型能跑起来？

ModelScope 24G的显存，没有一个大模型能跑起来？
是代码层面做了什么优化吗？和modelscope版本有关吗

展开

收起

真的很搞笑 2023-11-16 07:05:10 384 版权

2 条回答

写回答

取消提交回答

sunrr
ModelScope的大模型通常需要大量的显存来运行。如果你的服务器只有24GB的显存，那么可能无法运行一些非常大的模型。这是因为深度学习模型通常需要大量的显存来存储其权重和激活。

以下是一些可能的解决方案：
1. 降低模型的规模。你可以尝试使用较小的模型，或者使用更小的输入尺寸。
2. 增加服务器的显存。你可以考虑升级服务器的硬件配置，增加显存的大小。
3. 使用分布式训练。通过将模型分布在多个GPU上运行，可以有效地减少单个GPU的显存需求。
4. 使用梯度累积。这是一种优化技术，可以通过累积多批次的梯度，然后在一次更新中应用这些梯度，从而减少每次迭代所需的显存。
5. 使用更高效的模型结构。一些更高效的模型结构，如EfficientNet和MobileNet，可以在保持高性能的同时，减少显存的需求。
2023-11-29 17:29:16

赞同展开评论
芯在这

一般量化版本显存占用比较少，int8差不多也就12G左右，按说没问题的。没有，内存增长到最大后可以跑。另一个模型damo/mplug_visual-question-answering_coco_large_en，没有没存增长。您可以在damo/mplug_visual-question-answering_coco_base_zh模型卡片上留言问一下。镜像我用的是registry.cn-hangzhou.aliyuncs.com/modelscope-repo/modelscope:ubuntu20.04-cuda11.8.0-py38-torch2.0.1-tf2.13.0-1.9.4，此回答整理自钉群“魔搭ModelScope开发者联盟群 ①”

2023-11-16 08:51:39

赞同展开评论

相关问答

使用modelscope下载开源大模型时出错

108

0

0

有没有详细一些的微调modelscope-funasr上模型的教程（非大模型）？

182

0

0

ModelScope 报显存不够如下图怎么解决？

216

1

0

modelscope大模型知识抽取框架 oneke，支持垂类的知识抽取吗？

130

1

0

为什么我微调modelscope大模型时报错，让我升级内核啊？能升级吗？

138

1

0

modelscope微调后的多模态大模型Qwen-VL和graghrag相结合构建知识库的案例有嘛？

172

0

0

modelscope-funasr的paraformer推理的显存是有什么决定的，为啥会不太稳定？

174

1

0

ModelScope中qwen为什么不支持寻常其他大模型都支持的特殊字符？

125

1

0

ModelScope有没有什么格式是大模型一定能够按照那个格式提取文字的？

70

1

0

ModelScope的swift能训练llama3.1的大模型吗？

91

1

0

ModelScope模型即服务

计算机视觉

包含图像分类、图像生成、人体人脸识别、动作识别、目标分割、视频生成、卡通画、视觉评价、三维视觉等多个领域

我要提问

相关文章

OBS美颜美肌插件安装使用教程

AI Ping：精准可靠的大模型服务性能评测平台

Python图片上采样工具 - RealESRGANer

pytorch基于AnimeFace128数据集训练DCGAN

【发票转表格明细】PDF发票提取到表，图片发票提取到表格，扫描件发票提取到表格，全电发票PDF，全电发票扫描件识别导出EXCEL表格数电发票

热门讨论

热门文章

我希望通过damo-YOLO训练1500*1500的图片

ModelScope下载速度慢怎么解决？

cpu部署报错 Torch not compiled with CUDA enabled

如何下载modelscope模型？

ModelScope中，模型下载默认路径在哪个路径？

com/action/joingroup?code=v1是什么意思

图片上色

ModelScope魔搭上的可以直接调用api用吗？

modelscope这个下载有点慢呀，好几次都超时了，怎么解决？

ModelScope中，大佬们4卡跑lora时，遇到这样的错，怎么解决？

展开全部

LHM：单图生成3D动画人！阿里开源建模核弹，高斯点云重构服装纹理

Cobalt：开源的流媒体下载工具，支持解析和下载全平台的视频、音频和图片，支持多种视频质量和格式，自动提取视频字幕

Qwen2.5-VL：阿里通义千问最新开源视觉语言模型，能够理解超过1小时的长视频

RF-DETR：YOLO霸主地位不保？开源 SOTA 实时目标检测模型，比眨眼还快3倍！

InvSR：开源图像超分辨率生成模型，提升分辨率，修复老旧照片为超清图像

STAR：南京大学联合字节开源视频超分辨率增强生成框架，视频清晰度一键提升，支持从低分辨率视频生成高分辨率视频

X-AnyLabeling：开源的 AI 图像标注工具，支持多种标注样式，适于目标检测、图像分割等不同场景

EchoMimicV2：阿里推出的开源数字人项目，能生成完整数字人半身动画

Manga Image Translator：开源的漫画文字翻译工具，支持多语言翻译并嵌入原图，保持漫画的原始风格和布局

video-analyzer：开源视频分析工具，支持提取视频关键帧、音频转录，自动生成视频详细描述

展开全部

还有其他疑问?