文档备案控制台

开发者社区 ModelScope模型即服务正文

7b chat做modelscope awq的int4量化，特别容易爆显存，怎么解决？

用swift做对baichuan2 7b chat做modelscope awq的int4量化，特别容易爆显存，怎么解决？

展开

收起

小小爱吃香菜 2024-05-25 20:35:58 400 版权

2 条回答

写回答

取消提交回答

为了利利

与vllm预分配显存有关，gpu_memory_utilization, max_model_len这两个可以设置一下哈。此回答整理自钉群“魔搭ModelScope开发者联盟群 ①”

2024-05-29 08:41:49

赞同展开评论
算精通

北京阿里云ACE会长

分批处理：

如果模型太大，无法一次性加载到GPU中，可以考虑将数据分批处理，每次只处理模型的一部分。
梯度累积：

使用梯度累积技术，通过在多个小批量上累积梯度，然后一次性更新权重，这样可以减少每次迭代所需的显存。

2024-05-26 08:00:51

赞同 6 展开评论

相关问答

modelscope-funasr这个量化模型在哪里下载？

366

0

0

ModelScope的dsw上部署通义千问-7B调用快速开始代码的时候发生了以下错误，请问怎么解决？

204

0

0

ModelScope中运行7B模型，报错：[rank0]: ,怎么解决？

320

1

0

ModelScope中，int2是什么，比int4还bt吗？

202

0

0

ModelScope未量化模型推理很快，双卡推理也很快，只有4卡非常慢，怎么解决？

236

0

0

awq量化模型，启动时，报图中警告，并且ModelScope模型推理速度非常慢，这应该怎么办？

512

1

0

如何用python 加载ModelScope中的模型

776

1

0

在modelscope-funasr换了带时间戳的模型但是语音转出来的结果为什么没有时间戳呢？

436

0

0

modelscope-funasr最新的gpu高吞吐服务用的模型和原来cpu的参数量是一样的么？

394

0

0

modelscope-funasr够支持直接在automodel类使用附加vad模型的参数吗？

368

0

0

ModelScope模型即服务

ModelScope旨在打造下一代开源的模型即服务共享平台，为泛AI开发者提供灵活、易用、低成本的一站式模型服务产品，让模型应用更简单！欢迎加入技术交流群：微信公众号：魔搭ModelScope社区，钉钉答疑群：44837352

我要提问

相关文章

Xcode 26.4.1 (17E202) 发布 - Apple 平台 IDE

Xcode 26.5 (17F42) 发布 - Apple 平台 IDE

Swift循环引用与可选类型内存泄漏避坑实战案例

开发原生App的优势

海外用户如何进行阿里云账号实名认证：痛点剖析与全渠道通关指南！！！

热门讨论

热门文章

com/action/joingroup?code=v1是什么意思

ModelScope中，模型下载默认路径在哪个路径？

cuda 是11.3，ModelScope的mmcv怎么安装？

modelscope-funasr的onnxruntime c++只能使用onnx结尾的模型吗？

ModelScope下载速度慢怎么解决？

ModelScope中，灵积模型服务怎么看账单比如如何看我的免费token额度还剩下多少?

ModelScope镜像地址是什么？

ModelScope这个免费额度可以在哪里查询啊？

ModelScope cuda装成功了用pipeline还是cpu咧？

使用创空间docke构建部署项目，构建成功，运行日志显示后端启动，但是前端无法连接

展开全部

中企投资印度新能源“有戏”吗？

2026 最新Stable Diffusion 本地部署教程下载安装使用详细图解（含官网安装包）

高效部署通义万相Wan2.1：ComfyUI文生/图生视频实战，工作流直取！

MNN-LLM App：在手机上离线运行大模型，阿里巴巴开源基于 MNN-LLM 框架开发的手机 AI 助手应用

嵌入式开发必备！Keil uVision5 C51 V9.61 安装激活 + 汉化完整教程, 含（Keil MDK 5.39）

Claude Code 四大定制机制完全指南：CLAUDE.md、Hooks、Skills、Subagents 怎么选怎么用

GLM-4V-Flash：智谱 AI 免费开放的图像理解大模型 API 接口

Gemini 3.5 Pro 泄露刷屏！前端一次成型赶超 Fable 5，7 月 17 日或将亮相

DeepSeek-V4开源：百万上下文，Agent能力比肩顶级闭源模型

Hermes Agent：深度技术剖析报告

展开全部

还有其他疑问?