备案控制台

开发者社区 ModelScope模型即服务正文

7b chat做modelscope awq的int4量化，特别容易爆显存，怎么解决？

用swift做对baichuan2 7b chat做modelscope awq的int4量化，特别容易爆显存，怎么解决？

展开

收起

小小爱吃香菜 2024-05-25 20:35:58 267 版权

2 条回答

写回答

取消提交回答

为了利利

与vllm预分配显存有关，gpu_memory_utilization, max_model_len这两个可以设置一下哈。此回答整理自钉群“魔搭ModelScope开发者联盟群 ①”

2024-05-29 08:41:49

赞同展开评论
算精通

北京阿里云ACE会长

分批处理：

如果模型太大，无法一次性加载到GPU中，可以考虑将数据分批处理，每次只处理模型的一部分。
梯度累积：

使用梯度累积技术，通过在多个小批量上累积梯度，然后一次性更新权重，这样可以减少每次迭代所需的显存。

2024-05-26 08:00:51

赞同 6 展开评论

相关问答

modelscope-funasr这个量化模型在哪里下载？

199

0

0

ModelScope的dsw上部署通义千问-7B调用快速开始代码的时候发生了以下错误，请问怎么解决？

95

0

0

ModelScope中运行7B模型，报错：[rank0]: ,怎么解决？

172

1

0

ModelScope中，int2是什么，比int4还bt吗？

87

0

0

ModelScope未量化模型推理很快，双卡推理也很快，只有4卡非常慢，怎么解决？

122

0

0

awq量化模型，启动时，报图中警告，并且ModelScope模型推理速度非常慢，这应该怎么办？

383

1

0

为什么modelscope模型库里面chinese-hubert-base 页面是错误，是模型下架吗

184

0

0

您好我想问一下，在modelscope用OneKE模型去做知识图谱应该用re 还是ner 呀？

123

0

0

ModelScope 漏译是模型的问题吗？

98

1

0

ModelScope中，以本地模型为原型训练模型怎么实现，能用.gguf格式的模型训练吗？

178

1

0

ModelScope模型即服务

ModelScope旨在打造下一代开源的模型即服务共享平台，为泛AI开发者提供灵活、易用、低成本的一站式模型服务产品，让模型应用更简单！欢迎加入技术交流群：微信公众号：魔搭ModelScope社区，钉钉群号：44837352

我要提问

相关文章

用Macbook微调Qwen3！手把手教你用微调给Qwen起一个新名字

Thinking Machines Lab最新研究结果如何复现？On-Policy Distillation让训练成本直降10倍

超长序列并行之Ulysses + Ring-Attention技术原理与实现

ModelScope魔搭社区发布月报 -- 25年11月

Kotlin vs Swift：现代移动开发的“双子星”全面对比

热门讨论

热门文章

dataset的版本问题导致与modelscope不兼容

我希望通过damo-YOLO训练1500*1500的图片

ModelScope下载速度慢怎么解决？

如何下载modelscope模型？

ModelScope中，模型下载默认路径在哪个路径？

com/action/joingroup?code=v1是什么意思

在ModelScope中，下载模型时的ssl问题怎么解决？!

关于模型的下载，huggingface下载速度太慢，如何在modelscope快速下载？

ModelScope qwen7b、14b、72b lora微调分别需要的显存和cpu内存是多少？

在ModelScope中，请问模型下载到本地的具体方法？

展开全部

中企投资印度新能源“有戏”吗？

Meta SAM3开源：让图像分割，听懂你的话

AgentEvolver：让智能体系统学会「自我进化」

Qwen3-VL新成员 2B、32B来啦！更适合开发者体质

Manga Image Translator：开源的漫画文字翻译工具，支持多语言翻译并嵌入原图，保持漫画的原始风格和布局

MNN-LLM App：在手机上离线运行大模型，阿里巴巴开源基于 MNN-LLM 框架开发的手机 AI 助手应用

智胜未来：国内大模型+Agent应用案例精选，以及主流Agent框架开源项目推荐

告别Hugging Face模型下载难题：掌握高效下载策略，畅享无缝开发体验

Gemini 3 Nano Banana 的MCP服务器开发设计和国内直连方案

阿里云通义千问向全社会开放！

展开全部

还有其他疑问?