ModelScope问题之加载训到一半保存的checkpoint接着训练如何解决

本文涉及的产品
模型训练 PAI-DLC,5000CU*H 3个月
模型在线服务 PAI-EAS,A10/V100等 500元 1个月
交互式建模 PAI-DSW,5000CU*H 3个月
简介: ModelScope训练是指在ModelScope平台上对机器学习模型进行训练的活动;本合集将介绍ModelScope训练流程、模型优化技巧和训练过程中的常见问题解决方法。

问题一:在ModelScope刚才训练了一个epoch,想继续训练,该怎么办呢?直接这样两行代码即可继续训练


在ModelScope刚才训练了一个epoch,想继续训练,该怎么办呢?这样两行代码即可继续训练吗?


参考回答:

可以


关于本问题的更多回答可点击原文查看:https://developer.aliyun.com/ask/484251?spm=a2c6h.14164896.0.0.17f11edfskzLVz


问题二:ModelScope通过GPT-3中文2.7B模型在诗词生成数据集上二次开发训练


ModelScope通过GPT-3中文2.7B模型在诗词生成数据集上二次开发训练 ,训练出的模型预测时报这个 ,请问有解决方式吗,训练过程没报错,模型文件夹:


参考回答:

数据集准备:为了在GPT-3中文模型上进行二次开发和训练,首先需要准备一个高质量的诗词数据集。数据集应该包含大量标准化的诗词文本,且格式一致,方便模型学习。

环境设置:确保您有权访问ModelScope平台,并且已经设置了必要的开发环境,包括安装了所需的软件包和库。

模型加载:在ModelScope平台上加载GPT-3中文2.7B模型。通常,这可以通过ModelScope提供的API或者SDK来完成。

二次训练:在现有GPT-3中文模型的基础上,使用您准备的诗词数据集来进行二次训练。这通常涉及到设置训练参数,如学习率、批次大小、训练轮数等。

训练过程监控:在训练过程中,监控模型的性能,确保模型在学习过程中没有过拟合或者欠拟合。可以通过设置验证集来评估模型在训练过程中的表现。

优化和调整:根据模型在训练过程中的表现,可能需要对模型的架构或训练参数进行调整,以达到更好的效果。

测试和评估:用另一组数据进行测试,评估模型的诗词生成能力。可以使用诗词质量、创新性、韵律等标准来评价生成的诗词。

模型部署:一旦模型训练完成并通过测试,就可以部署模型,使其可以响应用户的请求进行诗词生成。


关于本问题的更多回答可点击原文查看:https://developer.aliyun.com/ask/493125?spm=a2c6h.14164896.0.0.17f11edfskzLVz


问题三:modelscope/ChineseText2SQL中提供的训练json数据的数据格式是什么?


modelscope/ChineseText2SQL中提供了如下的训练json数据,但没有给出其中字段的中文含义,能否提供一下其中各个字段的中文含义。

{
    "table_id": "excel_通用_google_1092607",
    "question": "男生彭胤的生源省市是哪里?",
    "action": [
        10
    ],
    "sql": {
        "agg": [
            0
        ],
        "sel": [
            3
        ],
        "cond_conn_op": 1,
        "conds": [
            [
                1,
                2,
                "彭方胤",
                "彭胤"
            ],
            [
                2,
                2,
                "男",
                "男生"
            ]
        ],
        "use_add_value": 0
    },
    "history_sql": null,
    "wvi_corenlp": [
        [
            2,
            3
        ],
        [
            0,
            1
        ]
    ],
    "question_tok": [
        "男",
        "生",
        "彭",
        "胤",
        "的",
        "生",
        "源",
        "省",
        "市",
        "是",
        "哪",
        "里",
        "?"
    ],
    "header_tok": [
        [
            "报",
            "名",
            "号"
        ],
        [
            "考",
            "生",
            "姓",
            "名"
        ],
        [
            "性",
            "别"
        ],
        [
            "生",
            "源",
            "省",
            "市"
        ],
        [
            "所",
            "在",
            "中",
            "学"
        ],
        [
            "考",
            "核",
            "资",
            "格",
            "大",
            "类"
        ],
        [
            "符",
            "合",
            "报",
            "名",
            "条",
            "件"
        ],
        [
            "空",
            "列"
        ]
    ],
    "bertindex_knowledge": [
        1,
        3,
        1,
        3,
        0,
        4,
        4,
        4,
        4,
        0,
        0,
        0,
        0
    ],
    "header_knowledge": [
        0,
        2,
        2,
        1,
        0,
        0,
        0
    ],
    "types": [
        "number",
        "text",
        "text",
        "text",
        "text",
        "text",
        "text",
        "null"
    ],
    "units": [
        [
            "null"
        ],
        [
            "null"
        ],
        [
            "null"
        ],
        [
            "null"
        ],
        [
            "null"
        ],
        [
            "null"
        ],
        [
            "null"
        ],
        [
            "null"
        ]
    ],
    "schema_link": [
        {
            "question_index": [
                0,
                1
            ],
            "column_index": 2,
            "label": "val"
        },
        {
            "question_index": [
                2,
                3
            ],
            "column_index": 1,
            "label": "val"
        },
        {
            "question_index": [
                5,
                8
            ],
            "column_index": 3,
            "label": "col"
        }
    ]
}


参考回答:

可以参考这个链接~

https://developer.aliyun.com/ask/488580?spm=a2c6h.13066369.question.7.3a766fc1DQZoXC


关于本问题的更多回答可点击原文查看:https://developer.aliyun.com/ask/491640?spm=a2c6h.14164896.0.0.17f11edfskzLVz


问题四:ModelScope中如何加载训到一半保存的checkpoint,接着训练吗?


ModelScope中如何加载训到一半保存的checkpoint,接着训练吗?升级1.3.2之后存储格式好像改了


参考回答:

用于继续训练 trainer.train(checkpoint_path=os.path.join(self.tmp_dir, 'iter_3.pth')) https://modelscope.cn/docs/%E6%A8%A1%E5%9E%8B%E7%9A%84%E8%AE%AD%E7%BB%83Train 


关于本问题的更多回答可点击原文查看:https://developer.aliyun.com/ask/490756?spm=a2c6h.14164896.0.0.14c71edfP7EB3l


问题五:ModelScope stable duffusion支持训练与推理吗?


ModelScope stable duffusion支持训练与推理吗?


参考回答:

目前配置好可以在web端进行训练。


关于本问题的更多回答可点击原文查看:https://developer.aliyun.com/ask/485411?spm=a2c6h.14164896.0.0.14c71edfP7EB3l

目录
相关文章
|
2月前
|
机器学习/深度学习 存储 缓存
ModelScope问题之训练完直接加载如何解决
ModelScope训练是指在ModelScope平台上对机器学习模型进行训练的活动;本合集将介绍ModelScope训练流程、模型优化技巧和训练过程中的常见问题解决方法。
67 3
|
2月前
|
开发框架 API 决策智能
ModelScope-Agent框架再升级!新增一键配置多人聊天,配套开源多智能体数据集和训练
ModelScope-Agent是魔搭社区推出的适配开源大语言模型(LLM)的AI Agent(智能体)开发框架,借助ModelScope-Agent,所有开发者都可基于开源 LLM 搭建属于自己的智能体应用。在最新升级完Assistant API和Tool APIs之后,我们又迎来了多智能体聊天室的升级,通过几分钟快速配置即可搭建一个全新的聊天室。
|
2月前
|
缓存 自然语言处理 监控
ModelScope评估二次训练模型报错如何解决
ModelScope模型报错是指在使用ModelScope平台进行模型训练或部署时遇到的错误和问题;本合集将收集ModelScope模型报错的常见情况和排查方法,帮助用户快速定位问题并采取有效措施。
188 0
|
2月前
|
异构计算 Docker Python
ModelScope问题之加载模型时报错size mismatch如何解决
ModelScope镜像是指用于在ModelScope平台上创建和管理的容器镜像,这些镜像包含用于模型训练和推理的环境和依赖;本合集将说明如何使用ModelScope镜像以及管理镜像的技巧和注意事项。
|
2月前
|
自然语言处理
在ModelScope中,你可以通过设置模型的参数来控制输出的阈值
在ModelScope中,你可以通过设置模型的参数来控制输出的阈值
40 1
|
2月前
|
API 语音技术
ModelScope-FunASR**有支持热词又支持时间戳的模型**。
【2月更文挑战第30天】ModelScope-FunASR**有支持热词又支持时间戳的模型**。
96 2
|
2月前
|
人工智能 API 决策智能
Modelscope结合α-UMi:基于Modelscope的多模型协作Agent
基于单个开源小模型的工具调用Agent,由于模型容量和预训练能力获取的限制,无法在推理和规划、工具调用、回复生成等任务上同时获得比肩大模型等性能。
|
2月前
|
文字识别 并行计算 语音技术
ModelScope问题之下载模型文件报错如何解决
ModelScope模型报错是指在使用ModelScope平台进行模型训练或部署时遇到的错误和问题;本合集将收集ModelScope模型报错的常见情况和排查方法,帮助用户快速定位问题并采取有效措施。
459 3
|
2月前
|
数据采集 自然语言处理 搜索推荐
ModelScope问题之模型encoder配置报错如何解决
ModelScope模型报错是指在使用ModelScope平台进行模型训练或部署时遇到的错误和问题;本合集将收集ModelScope模型报错的常见情况和排查方法,帮助用户快速定位问题并采取有效措施。
125 0
|
2月前
|
人工智能 达摩院 自然语言处理
超好用的开源模型平台,ModelScope阿里达摩院
超好用的开源模型平台,ModelScope阿里达摩院
204 1