文档备案控制台

开发者社区 ModelScope模型即服务自然语言处理正文

多卡训练得到的GPT3-2.7B模型，推理pipeline加载模型时报错size mismatch

使用官网镜像registry.cn-hangzhou.aliyuncs.com/modelscope-repo/modelscope:ubuntu20.04-cuda11.3.0-py37-torch1.11.0-tf1.15.5-1.3.0 4卡V100 finetune GPT3-2.7B得到output模型文件后，用

报错模型size mismatch，刚好差了4倍

展开

收起

GPT-3预训练生成模型-中文-2.7B

游客5rty4zy6dfpts 2023-03-07 19:53:19 1279 版权

3 条回答

写回答

取消提交回答

1847693217120503

尝试一下我修复的bug的版本

https://github.com/zhangzhenyu13/modelscope-debugged

2023-03-16 17:35:02

赞同 1 展开评论
1296995534731106

您好，给您带来的不便深表歉意，在1.3.0版本中存在GPT3存储checkpoint的一个bug，建议更新至1.3.2版本进行训练和推理

2023-03-08 21:26:21

赞同展开评论
turbo_zhang

咱俩一样，加我微信15821444815，讨论一下

2023-03-08 09:59:54

赞同展开评论

相关问答

自然语言处理

如何实例化一个聊天模型，并指定使用GPT-4？

188

1

0

训练一个GPT-3模型大概需要多少计算量和算力？

2258

3

0

在GPT等大模型的加持下，新必应带来了哪些变革？

141

2

0

ARTIST模型如何通过GPT生成图像序列？

131

1

0

GPT-4的多模态模型有什么特点？

145

1

0

预训练和推理在GPT中分别指什么？

176

1

0

阿里云百炼模型广场是有GPT模型吗？

271

1

0

如何评价 OpenAI 最新发布支持实时语音对话的模型GPT-4o？

3188

119

0

ModelScope配置里面有gpt-3.5-turbo 这个模型好像调用不了？

501

3

0

Modelscope在EAS部署了一个模型库的模型，是自己训练的GPT3，为什么现在报了这个错误？

270

3

0

ModelScope模型即服务

自然语言处理

包含命名实体识别、文本分类、分词、关系抽取、问答、推理、文本摘要、情感分析、机器翻译等多个领域

我要提问

相关文章

[大模型实战 01] 本地大模型初体验：Ollama 部署与 Python 调用指南

[大模型实战 03预备] 云端炼丹房 1：Google Colab 上手指南

[大模型实战 03] 拆解 Transformers：从原理图解到 HuggingFace Transformers 实战

[大模型实战 05] 大模型实战的杀手锏：模型微调

[大模型实战 06] 我的模型我做主：在 Kaggle 上用 Unsloth 极速微调 Qwen3

热门讨论

热门文章

本地Pipeline调用nlp_csanmt_translation_en2zh_base，报错问题

modelscope-funasr 热词如何设置？

在modelscope-funasr针对中文通话 SenseVoice和paraforma效果谁好？

如何下载llama模型到本地？

本地使用nlp_csanmt_translation_en2zh，运行示例代码报错

modelscope-funasr这个进度条的日志去掉呢？

modelscope-funasr实时设别，mode:2pass 还是online，2个有啥不一样？

通义灵码2.7.2版本智能体功能是不是用不了了，为何每次涉及到操作文件的问题都卡在那里不动了

请问微调开元模型qwe1.5b 和 7b 分别支持数据集的上下文长度是多少个汉字/token？

如何修改通义千问的system prompt，以修改自定义名字

展开全部

[大模型实战 01] 本地大模型初体验：Ollama 部署与 Python 调用指南

使用宝塔面板部署 AstrBot 与 NapCat 实现 QQ 机器人

智胜未来：国内大模型+Agent应用案例精选，以及主流Agent框架开源项目推荐

OpenScholar：华盛顿大学联合艾伦研究所开源的学术搜索工具

Cline：29.7K Star！一文详解VSCode最强开源AI编程搭子：一键生成代码+自动跑终端+操控浏览器...

[大模型实战 03] 拆解 Transformers：从原理图解到 HuggingFace Transformers 实战

写小说时，Claude 4.0 和 4.5 的差别在哪里？

Potpie.ai：比Copilot更狠！这个AI直接接管项目代码，自动Debug+测试+开发全搞定

ComfyUI-Copilot：阿里把AI助手塞进ComfyUI：一句话生成工作流，自动布线/调参/选模型，小白秒变大神！

Botgroup.chat：超有趣的开源 AI 聊天室！多个 AI 在线互怼，一键搭建你的专属 AI 社群

展开全部

还有其他疑问?