文档备案控制台

开发者社区 ModelScope模型即服务自然语言处理正文

魔搭swift对Baichuan2-13B-Chat-4bits全量微调（full）,保存模型报错

使用魔搭swift对Baichuan2-13B-Chat-4bits全量微调（full）,保存模型的时候报错：
NotImplementedError: You are calling save_pretrained on a 4-bit converted model. This is currently not supported

展开

收起

aliyun4278628757-46468 2023-11-13 12:02:49 480 版权

2 条回答

写回答

取消提交回答

sunrr
这个错误是因为你在尝试保存一个已经被转换为4位精度的模型。目前，魔搭Swift不支持保存这种类型的模型。

解决这个问题的方法是将模型恢复到原始的8位精度，然后进行保存。你可以参考以下步骤：
1. 加载模型：首先，你需要加载你正在使用的模型。这通常通过调用model.from_pretrained(model_name)来实现。
2. 恢复模型精度：然后，你需要将模型的精度从4位恢复到8位。这可以通过调用model.convert_to_fp32()来实现。
3. 保存模型：最后，你可以调用model.save_pretrained(output_dir)来保存模型。
2023-11-30 16:22:40

赞同 1 展开评论
1941623231718325
根据报错信息来看，你正在尝试对一个经过4位量化（4-bit quantization）的模型进行保存，但是当前版本的魔搭（MMDetection）中并不支持对4位量化的模型进行保存。

4位量化是一种用于减小模型大小和加速推理的技术，但是在某些情况下，会限制一些操作，比如模型的保存和加载等。目前，一些深度学习框架可能还不支持对4位量化模型的完全保存和加载。

为了解决这个问题，你可以考虑以下几种方法：
1. 检查是否有最新版本的魔搭（MMDetection）或者相关库已经支持对4位量化模型的保存和加载。有时候，新版本的框架会解决一些旧版本存在的问题。
2. 如果最新版本的框架仍然不支持对4位量化模型的保存，你可以考虑将模型保存为未经量化的版本，或者使用其他技术来减小模型大小和加速推理，比如剪枝（pruning）等。
2023-11-14 16:55:52

赞同 2 展开评论

相关问答

请问如何使用ms-swift工具验证模型微调的效果？

297

0

0

魔塔的swift web-ui 训练好后模型要怎么导出

232

0

0

swift webui导出模型时报KeyError: 'base_model.model.model

525

2

0

swift pod 'AlibabacloudOcrApi20210707'之后报错

245

2

0

请问用modelscope里swift的dpo微调模型的断点Debug方式，有相关文档说明吗？

405

1

0

ModelScope我试着用swift 微调后微调的模型都失去逻辑怎么办？

223

1

0

ModelScope中，使用SWIFT的进行sft报错，这是要升级驱动？

222

1

0

请问ModelScope的swift部署本地模型有文章推荐吗？

115

0

0

modelscope的swift昨天部署还是正常运行的，今天重启电脑后就一直报错如下错误，怎么解决？

92

1

0

用swift推理训练后的ModelScope模型，参数里model stype是不是就不需要？

157

1

0

ModelScope模型即服务

自然语言处理

包含命名实体识别、文本分类、分词、关系抽取、问答、推理、文本摘要、情感分析、机器翻译等多个领域

我要提问

相关文章

贝聿铭的 “数字续作”：蚂蚁百宝箱 × 苏州博物馆，用 AI 重构文化地标

一年输送旅客数千万次，浦东国际机场的效率秘密藏在这个智能体里

宝塔部署AstrBot及Napcat防踩坑教程

Xcode 26.2 (17C52) 发布 - Apple 平台 IDE

ModelScope魔搭社区发布月报 -- 25年12月

热门讨论

热门文章

modelscope-funasr实时ASR的微调该怎么操作？

在modelscope-funasr想自己训练一种low resource 的方言，有训练的方案吗？

modelscope-funasr的paraformer模型从0训练可以用来做音频识别音素模型吗？

在modelscope-funasr同样的文件，文本强制对齐，有时运行成功，有时运行爆显存，为什么？

modelscope-funasr能推理网络地址的音频文件么？

vllm部署模型，参数如何指定

modelscope-funasr的paraformer热词版本配置是不是不支持添加权重？

modelscope-funasr中8k模型与16k的区别有文档介绍或者说明吗？一直没找到在哪里？

modelscope-funasr 热词如何设置？

modelscope-funasr实时设别，mode:2pass 还是online，2个有啥不一样？

展开全部

智胜未来：国内大模型+Agent应用案例精选，以及主流Agent框架开源项目推荐

Cline：29.7K Star！一文详解VSCode最强开源AI编程搭子：一键生成代码+自动跑终端+操控浏览器...

告别Hugging Face模型下载难题：掌握高效下载策略，畅享无缝开发体验

RAG+AI工作流+Agent：LLM框架该如何选择，全面对比MaxKB、Dify、FastGPT、RagFlow、Anything-LLM,以及更多推荐

Qlib：华尔街颤抖！微软开源金融AI量化投资神器，助力智能投研

FastAPI开发者福音！FastAPI-MCP：将FastAPI秒变MCP服务器的开源神器，无需配置自动转换！

CodeArena：在线 LLM 编程竞技场！用于测试不同开源 LLM 的编程能力，实时更新排行榜

Yuxi-Know：开源智能问答系统，基于大模型RAG与知识图谱技术快速构建知识库

FastExcel：开源的 JAVA 解析 Excel 工具，集成 AI 通过自然语言处理 Excel 文件，完全兼容 EasyExcel

宝塔部署AstrBot及Napcat防踩坑教程

展开全部

还有其他疑问?