备案控制台

开发者社区 ModelScope模型即服务自然语言处理正文

多卡训练得到的GPT3-2.7B模型，推理pipeline加载模型时报错size mismatch

使用官网镜像registry.cn-hangzhou.aliyuncs.com/modelscope-repo/modelscope:ubuntu20.04-cuda11.3.0-py37-torch1.11.0-tf1.15.5-1.3.0 4卡V100 finetune GPT3-2.7B得到output模型文件后，用

报错模型size mismatch，刚好差了4倍

展开

收起

GPT-3预训练生成模型-中文-2.7B

游客5rty4zy6dfpts 2023-03-07 19:53:19 1232 版权

3 条回答

写回答

取消提交回答

1847693217120503

尝试一下我修复的bug的版本

https://github.com/zhangzhenyu13/modelscope-debugged

2023-03-16 17:35:02

赞同 1 展开评论
1296995534731106

您好，给您带来的不便深表歉意，在1.3.0版本中存在GPT3存储checkpoint的一个bug，建议更新至1.3.2版本进行训练和推理

2023-03-08 21:26:21

赞同展开评论
turbo_zhang

咱俩一样，加我微信15821444815，讨论一下

2023-03-08 09:59:54

赞同展开评论

相关问答

自然语言处理

如何实例化一个聊天模型，并指定使用GPT-4？

118

1

0

训练一个GPT-3模型大概需要多少计算量和算力？

1940

3

0

在GPT等大模型的加持下，新必应带来了哪些变革？

92

2

0

ARTIST模型如何通过GPT生成图像序列？

98

1

0

GPT-4的多模态模型有什么特点？

103

1

0

预训练和推理在GPT中分别指什么？

122

1

0

阿里云百炼模型广场是有GPT模型吗？

180

1

0

如何评价 OpenAI 最新发布支持实时语音对话的模型GPT-4o？

2952

119

0

ModelScope配置里面有gpt-3.5-turbo 这个模型好像调用不了？

422

3

0

Modelscope在EAS部署了一个模型库的模型，是自己训练的GPT3，为什么现在报了这个错误？

214

3

0

ModelScope模型即服务

自然语言处理

包含命名实体识别、文本分类、分词、关系抽取、问答、推理、文本摘要、情感分析、机器翻译等多个领域

我要提问

相关文章

Java 大视界 -- Java 大数据机器学习模型在自然语言处理中的对抗训练与鲁棒性提升（205）

“日志别再只会翻了，教它自己说话”——聊聊用 NLP 玩转日志分析

《10分钟开发电商页！CodeBuddy自然语言转代码实测：程序员效率革命》

Java 大视界 -- Java 大数据机器学习模型在自然语言生成中的可控性研究与应用（229）

从“写SQL”到“聊数据”：NL2SQL如何用自然语言解锁数据库？

热门讨论

热门文章

modelscope-funasr模型选择whisper large v3，不出时间戳是正常的吗？

部署funasr-sdk-cpu-0.4.7，无法切换vad为8k模型，提示不存在v2.0.6版本

请问微调开元模型qwe1.5b 和 7b 分别支持数据集的上下文长度是多少个汉字/token？

modelscope-funasr 热词如何设置？

modelscope-funasr实时设别，mode:2pass 还是online，2个有啥不一样？

modelscope-funasr如何释放显存呢？

练的pth模型文件，怎么转成bin文件？

modelscope-funasr模型可以国产化吗？可以部署在昇腾NPU上吗？

数据分析模型

modelscope-funasr输出的结果里可以区分说话人吗？

展开全部

智胜未来：国内大模型+Agent应用案例精选，以及主流Agent框架开源项目推荐

Cline：29.7K Star！一文详解VSCode最强开源AI编程搭子：一键生成代码+自动跑终端+操控浏览器...

Qlib：华尔街颤抖！微软开源金融AI量化投资神器，助力智能投研

告别Hugging Face模型下载难题：掌握高效下载策略，畅享无缝开发体验

FastAPI开发者福音！FastAPI-MCP：将FastAPI秒变MCP服务器的开源神器，无需配置自动转换！

RAG+AI工作流+Agent：LLM框架该如何选择，全面对比MaxKB、Dify、FastGPT、RagFlow、Anything-LLM,以及更多推荐

手把手教你使用 Ollama 和 LobeChat 快速本地部署 DeepSeek R1 模型，创建个性化 AI 助手

FastExcel：开源的 JAVA 解析 Excel 工具，集成 AI 通过自然语言处理 Excel 文件，完全兼容 EasyExcel

Memoripy：支持 AI 应用上下文感知的记忆管理 Python 库

Yuxi-Know：开源智能问答系统，基于大模型RAG与知识图谱技术快速构建知识库

展开全部

还有其他疑问?