备案控制台

开发者社区 ModelScope模型即服务正文

各位大佬辛苦帮忙看下ModelScope这个问题。我在damo/nlp_g

各位大佬辛苦帮忙看下ModelScope这个问题。我在damo/nlp_gpt3_text-generation_1.3B这个模型的基础上进行二次开发训练，但是使用训练后的模型进行预测结果跟没有训练的模型是一模一样的，这个是什么原因呢。loss是在收敛的。是训练数据太少吗。还是预测时候引入的模型不对。参照的是这个文档：https://www.modelscope.cn/models/damo/nlp_gpt3_text-generation_1.3B/summary

展开

收起

真的很搞笑 2023-04-22 11:30:14 150 版权

1 条回答

写回答

取消提交回答

芯在这

您好，我看您的 train.py 文件中没有加入 MegatronHook，需要有这个 hook 才能正常保存 checkpoint～可以参考 https://modelscope.cn/models/damo/nlp_gpt3_text-generation_1.3B/summary model card 中的训练代码示例，此回答整理自钉群“魔搭ModelScope开发者联盟群 ①”

2023-04-27 08:25:39

赞同展开评论

相关问答

在下载modelscope[nlp]时会卡住

235

0

0

安装验证，pip install modelscope[nlp] 报错

374

0

0

modelscope必须大于等于3.8才可以成功安装scope【nlp吗？

385

2

0

在安装modelscope[nlp]的时候遇到报错怎么解决？

158

1

0

想在PAI平台里离线调用NLP模型，发现平台不支持比较高的ModelScope版本，要怎么解决呢？

114

1

0

ModelScope锁定了damo/mgeo文件夹？

84

0

0

在安装modelscope[nlp]时，仍报 dependency conflict怎么办？

259

2

0

在modelscope上copy项目启动失败，日志显示超时，能否帮忙看下是什么原因呢？

107

0

0

modelscope-funasr支持asr + nlp + tts的组合吗？语音输入，语音输出？

164

0

0

怎么在modelscope-funasr中切换要使用的模型呢？damo中只有5个模型，能从ModeS

110

0

0

ModelScope模型即服务

ModelScope旨在打造下一代开源的模型即服务共享平台，为泛AI开发者提供灵活、易用、低成本的一站式模型服务产品，让模型应用更简单！欢迎加入技术交流群：微信公众号：魔搭ModelScope社区，钉钉群号：44837352

我要提问

相关文章

蚂蚁百宝箱联手深铁打造全国首个地铁 AI 智能体「深铁宝」：你的全能城市向导来啦~

MajorRAG 概述（1/3）

蚂蚁百宝箱“一箱搞定”会展智能，「桐小乌」为乌镇互联网大会提供全天候一站式向导服务

最佳实践丨让苏东坡“复活”！我用Qwen3-8B实现了与千古文豪的跨时空对话

全来店×蚂蚁百宝箱：智能体开启连锁餐饮智慧化服务新时代

热门讨论

热门文章

ModelScope中，模型下载默认路径在哪个路径？

我希望通过damo-YOLO训练1500*1500的图片

dataset的版本问题导致与modelscope不兼容

ModelScope下载速度慢怎么解决？

如何下载modelscope模型？

qwen3-32b和qwen-2.5-32b-Instruct有什么区别

ModelScope有部署qwen2-72b的么，正常推理需要多大的显存？

ModelScope qwen7b、14b、72b lora微调分别需要的显存和cpu内存是多少？

modelscope这个下载有点慢呀，好几次都超时了，怎么解决？

ModelScope的PAI-DSW中，怎么上传一个文件夹？

展开全部

Qwen3-VL新成员 2B、32B来啦！更适合开发者体质

让AI单次生成4万字！WriteHERE：开源AI长文写作框架，单次生成超长文本，小说报告一键搞定！

码上生花：用API链接Qwen-Image系列及衍生LoRA生态模型

MNN-LLM App：在手机上离线运行大模型，阿里巴巴开源基于 MNN-LLM 框架开发的手机 AI 助手应用

Manga Image Translator：开源的漫画文字翻译工具，支持多语言翻译并嵌入原图，保持漫画的原始风格和布局

Meta SAM3开源：让图像分割，听懂你的话

ModelScope魔搭社区发布月报 -- 25年11月

AgentScope：阿里开源多智能体低代码开发平台，支持一键导出源码、多种模型API和本地模型部署

一文读懂“大语言模型”

智胜未来：国内大模型+Agent应用案例精选，以及主流Agent框架开源项目推荐

展开全部

还有其他疑问?