备案控制台

开发者社区 ModelScope模型即服务文章正文

ModelScope问题之训练完直接加载如何解决

2024-02-28 254

版权

版权声明：

本文内容由阿里云实名注册用户自发贡献，版权归原作者所有，阿里云开发者社区不拥有其著作权，亦不承担相应法律责任。具体规则请查看《阿里云开发者社区用户服务协议》和《阿里云开发者社区知识产权保护指引》。如果您发现本社区中有涉嫌抄袭的内容，填写侵权投诉表单进行举报，一经查实，本社区将立刻删除涉嫌侵权内容。

本文涉及的产品

模型在线服务 PAI-EAS，A10/V100等 500元 1个月

模型训练 PAI-DLC，100CU*H 3个月

交互式建模 PAI-DSW，每月250计算时 3个月

简介： ModelScope训练是指在ModelScope平台上对机器学习模型进行训练的活动；本合集将介绍ModelScope训练流程、模型优化技巧和训练过程中的常见问题解决方法。

问题一：ModelScope如果训练数据较大（上TB级别的），应该怎么加载训练数据集，有示例代码吗？

ModelScope如果训练数据较大（上TB级别的），应该怎么加载训练数据集，有示例代码吗？kwargs = dict( model='damo/nlp_gpt3_text-generation_chinese-large', train_dataset=train_dataset, eval_datase=eval_dataset, max_epochs=max_epochs, work_dir=tmp_dir, cfg_modify_fn=cfg_modify_fn) train_dataset　和　eval_dataset　只能一次加载吗？如果数据集合比较大，内存没那么大

参考回答：

如果本地磁盘没有足够空间的话，可以在加载数据集的时候使用streaming模式，即 ds = MsDataset.load(..., use_streaming=True) ；具体是modelscope上的哪个数据集呢？如果是这种方式的话，在访问ds对象的时候直接 for item in ds，然后得到的应该是单条数据内容(for 文本数据集)或者单个文件的本地缓存路径(for 其它类型数据集)；

关于本问题的更多回答可点击原文查看：https://developer.aliyun.com/ask/485452?spm=a2c6h.14164896.0.0.14c71edfP7EB3l

问题二：在modelscope上用预训练模型做的继续训练，为什么训练的精度会随着epoch的增加而降低？

在modelscope上用预训练模型做的继续训练，为什么训练的精度会随着epoch的增加而降低？

参考回答：

在ModelScope上的预训练模型的精度会随着epoch的增加而降低，因为训练过程中，由于迭代次数的增加，模型可能受到了过度拟合。解决方案是在训练过程中引入一些正则化机制，以防止过度拟合。

关于本问题的更多回答可点击原文查看：https://developer.aliyun.com/ask/484262?spm=a2c6h.14164896.0.0.14c71edfP7EB3l

问题三：在modelscope的底座模型基础上做一些mlm训练，modelscope有这个mlm的代码吗？

在modelscope的底座模型基础上做一些mlm训练，modelscope有这个mlm的代码吗？

参考回答：

可以参考 https://www.modelscope.cn/models/damo/nlp_structbert_backbone_base_std/summary

关于本问题的更多回答可点击原文查看：https://developer.aliyun.com/ask/485412?spm=a2c6h.14164896.0.0.14c71edfP7EB3l

问题四：modelscope vad的训练数据是标注的吗？

modelscope vad的训练数据是标注的吗？效果感觉很好。通过kaldi对齐制作vad训练数据，感觉做不到这么好吧，什么时候可以像asr一样可以微调啊？

参考回答：

开源的模型是线上最优模型，数据、模型与算法方面都做了不少的工作。finetune暂时没有排期，目前在做的是增加8k vad模型，以及流式vad，可以支持关注funasr后续动作：https://github.com/alibaba-damo-academy/FunASR

关于本问题的更多回答可点击原文查看：https://developer.aliyun.com/ask/484248?spm=a2c6h.14164896.0.0.14c71edfP7EB3l

问题五：ModelScope这我训练完看文档都没看明白怎么调用这样直接加载不行么？

ModelScope这我训练完看文档都没看明白怎么调用

这样直接加载不行么？

参考回答：

里面有个文件夹叫output，那个里面的是推理用的文件，pth文件是用于继续训练的文件，还存储了trainer的随机状态、optimizer state等

关于本问题的更多回答可点击原文查看：https://developer.aliyun.com/ask/485396?spm=a2c6h.14164896.0.0.25be1edf0PUp6f

文章标签：

语音技术

机器学习/深度学习

算法

缓存

存储

关键词：

modelscope训练

modelscope加载

modelscope训练加载

芯在这

目录

相关文章

芯在这

|

机器学习/深度学习存储 JSON

ModelScope问题之加载训到一半保存的checkpoint接着训练如何解决

ModelScope训练是指在ModelScope平台上对机器学习模型进行训练的活动；本合集将介绍ModelScope训练流程、模型优化技巧和训练过程中的常见问题解决方法。

芯在这

293 0 0

芯在这

|

机器学习/深度学习安全

ModelScope问题之轮数没有训练完推理有影响如何解决

ModelScope训练是指在ModelScope平台上对机器学习模型进行训练的活动；本合集将介绍ModelScope训练流程、模型优化技巧和训练过程中的常见问题解决方法。

芯在这

147 0 0

modelscope

|

6月前

|

算法物联网 Swift

Qwen3 X ModelScope工具链: 飞速训练 + 全面评测

Qwen于近日发布了Qwen3系列模型，包含了各个不同规格的Dense模型和MoE模型。开源版本中，Dense模型基本沿用了之前的模型结构，差别之处在于对于Q和K两个tensor增加了RMSNorm；MoE模型去掉了公共Expert，其他结构基本与前一致。在模型大小上，涵盖了从0.6B到32B（Dense）和235B（MoE）不同的尺寸。

modelscope

879 15 15

sinmu

|

9月前

|

人工智能物联网

如何将Together AI上基于Qwen2-7B训练的模型部署到ModelScope平台

如何将Together AI上基于Qwen2-7B训练的模型部署到ModelScope平台

sinmu

207 10 10

ModelScope内容运营小助手

|

开发框架 API 决策智能

ModelScope-Agent框架再升级！新增一键配置多人聊天，配套开源多智能体数据集和训练

ModelScope-Agent是魔搭社区推出的适配开源大语言模型（LLM）的AI Agent（智能体）开发框架，借助ModelScope-Agent，所有开发者都可基于开源 LLM 搭建属于自己的智能体应用。在最新升级完Assistant API和Tool APIs之后，我们又迎来了多智能体聊天室的升级，通过几分钟快速配置即可搭建一个全新的聊天室。

ModelScope内容运营小助手

1177 2 2

真的很搞笑

|

缓存自然语言处理监控

ModelScope评估二次训练模型报错如何解决

ModelScope模型报错是指在使用ModelScope平台进行模型训练或部署时遇到的错误和问题；本合集将收集ModelScope模型报错的常见情况和排查方法，帮助用户快速定位问题并采取有效措施。

真的很搞笑

827 0 0

真的很搞笑

|

异构计算 Docker Python

ModelScope问题之加载模型时报错size mismatch如何解决

ModelScope镜像是指用于在ModelScope平台上创建和管理的容器镜像，这些镜像包含用于模型训练和推理的环境和依赖；本合集将说明如何使用ModelScope镜像以及管理镜像的技巧和注意事项。

真的很搞笑

343 0 0

芯在这

|

自然语言处理搜索推荐 PyTorch

ModelScope问题之NoteBook训练个性化语音合成模型报错如何解决

ModelScope训练是指在ModelScope平台上对机器学习模型进行训练的活动；本合集将介绍ModelScope训练流程、模型优化技巧和训练过程中的常见问题解决方法。

芯在这

232 0 0

芯在这

|

数据采集机器学习/深度学习算法

modelscope问题之m-plug微调训练自己的模型如何解决

ModelScope训练是指在ModelScope平台上对机器学习模型进行训练的活动；本合集将介绍ModelScope训练流程、模型优化技巧和训练过程中的常见问题解决方法。

芯在这

411 0 0

sunrr

|

自然语言处理

在ModelScope中，你可以通过设置模型的参数来控制输出的阈值

在ModelScope中，你可以通过设置模型的参数来控制输出的阈值

sunrr

432 1 1

ModelScope模型即服务

热门文章

最新文章

Qwen3-VL新成员 2B、32B来啦！更适合开发者体质

万字长文深度解析最新Deep Research技术：前沿架构、核心技术与未来展望

MNN-LLM App：在手机上离线运行大模型，阿里巴巴开源基于 MNN-LLM 框架开发的手机 AI 助手应用

Qwen3-VL再添丁！4B/8B Dense模型开源，更轻量，仍强大

AgentScope：阿里开源多智能体低代码开发平台，支持一键导出源码、多种模型API和本地模型部署

智胜未来：国内大模型+Agent应用案例精选，以及主流Agent框架开源项目推荐

【AI绘画】你有多久没有打开SD了？

Dolphin：40语种+22方言！清华联合海天瑞声推出的语音识别大模型，识别精度超Whisper两代

Qlib：华尔街颤抖！微软开源金融AI量化投资神器，助力智能投研

仅100多元，他给视障人群装上AI“眼睛”

腾讯混元世界模型1.1开源：支持多视图及视频输入，单卡部署，秒级生成_魔搭ModelScope社区-ModelScope魔搭社区

「超级开发个体」在诞生：一份白皮书带你理解AI时代开发者

Qwen3-VL新成员 2B、32B来啦！更适合开发者体质

万字长文深度解析最新Deep Research技术：前沿架构、核心技术与未来展望

【AI绘画】你有多久没有打开SD了？

新手小白一枚，想训练一个专属的题库AI模型，求大佬带

Face-to-Photo 模型开源！联名麦橘MERJIC，遇见另一个你！

ModelScope魔搭社区发布月报 -- 25年10月

Qwen3-VL再添丁！4B/8B Dense模型开源，更轻量，仍强大

相关课程

更多

个性化语音合成模型微调

ModelScope社区Library技术架构介绍

相关电子书

更多

视觉AI能力的开放现状及ModelScope实战

ModelScope助力语音AI模型创新与应用

低代码开发师（初级）实战教程

下一篇

阿里云oss简介和如何对接使用