文档备案控制台

开发者社区 ModelScope模型即服务正文

怎么设置可以实现合并￥量化后的ModelScope模型的group_size=64呢？

Qwen1.5-14b-chat模型微调完之后，想要合并和量化为gptq-int4模型，怎么设置可以实现合并￥量化后的ModelScope模型的group_size=64呢？

展开

收起

小小爱吃香菜 2024-07-17 08:24:47 288 版权

2 条回答

写回答

取消提交回答

为了利利

swift/llm/export.py。此回答整理自钉群“魔搭ModelScope开发者联盟群 ①”

2024-07-23 15:42:03

赞同展开评论
听风de歌

Qwen1.5-14b-chat模型微调后合并并量化为GPTQ-INT4模型，设置group_size=64，这通常涉及到模型的优化和部署配置。具体步骤通常包括模型的序列化、优化器状态的处理以及量化参数的设置。以下是一个大致的流程：

微调完成后，您需要保存模型的权重和配置，例如使用torch.save()函数保存模型状态。
使用特定的工具或库，如modelscope或paddledistil（针对PaddlePaddle框架），来进行模型的合并。
在量化过程中，设置group_size=64，这通常是在量化配置文件中指定的，比如在TensorRT的配置文件中，或者在量化库的API参数中。可参官方文档

2024-07-17 14:46:53

赞同 6 展开评论

相关问答

modelscope-funasr这个量化模型在哪里下载？

371

0

0

modelscope-funasr设置这个单位长度是什么参数？

532

1

0

在modelscope-funasr中如何设置不打印这些日志吗？

269

0

0

图中 ModelScope这样设置的怎么解决？

225

0

0

ModelScope中，图中设置没有生效，还是放大了四倍，是得改源码吗？

177

1

0

请问ModelScope是不是ip设置的问题才出现图中错误，怎么设置呢？

189

0

0

modelscope-funasr怎么设置使用指定的显卡计算吗？

343

1

0

ModelScope认证有办法关闭吗？还是需要去设置证书？

383

2

0

在ModelScope模型微调后立马进行模型合并，有这样的功能么？

262

1

0

ModelScope微调后的模型，如何合并权重，以及合并后的权重，如何加载？

284

0

0

ModelScope模型即服务

ModelScope旨在打造下一代开源的模型即服务共享平台，为泛AI开发者提供灵活、易用、低成本的一站式模型服务产品，让模型应用更简单！欢迎加入技术交流群：微信公众号：魔搭ModelScope社区，钉钉答疑群：44837352

我要提问

相关解决方案

更多

GLM-5.2：长任务时代开源旗舰模型

基于 Spark 和 PyTorch 的模型训练方案

OpenAI 重磅开源，快速部署GPT-OSS模型

模型蒸馏：让0.6B模型媲美235B模型

一键训练模型及部署GPU共享推理服务

热门讨论

热门文章

com/action/joingroup?code=v1是什么意思

ModelScope中，模型下载默认路径在哪个路径？

ModelScope下载速度慢怎么解决？

modelscope这个下载有点慢呀，好几次都超时了，怎么解决？

请问Modelscope互联网如何访问Notebook的服务呢？

ModelScope这个免费额度可以在哪里查询啊？

IndexTTS 部署报错：No module named 'tn'

ModelScope免费额度完了，在哪里购买？

ModelScope中apikey在哪申请？

qwen3-32b和qwen-2.5-32b-Instruct有什么区别

展开全部

MNN-LLM App：在手机上离线运行大模型，阿里巴巴开源基于 MNN-LLM 框架开发的手机 AI 助手应用

DeepSeek-V4开源：百万上下文，Agent能力比肩顶级闭源模型

GLM-4V-Flash：智谱 AI 免费开放的图像理解大模型 API 接口

嵌入式开发必备！Keil uVision5 C51 V9.61 安装激活 + 汉化完整教程, 含（Keil MDK 5.39）

使用宝塔面板部署 AstrBot 与 NapCat 实现 QQ 机器人

ModelScope介绍：魔搭社区是什么？在魔搭社区能做哪些事？

Claude Code 四大定制机制完全指南：CLAUDE.md、Hooks、Skills、Subagents 怎么选怎么用

AgentScope：阿里开源多智能体低代码开发平台，支持一键导出源码、多种模型API和本地模型部署

LTX-2.3开源：视频生成引擎级升级

阿里云通义千问向全社会开放！

展开全部

还有其他疑问?