ModelScope问题之加载训到一半保存的checkpoint接着训练如何解决-阿里云开发者社区

ModelScope问题之加载训到一半保存的checkpoint接着训练如何解决

2024-02-28 459

版权

本文内容由阿里云实名注册用户自发贡献，版权归原作者所有，阿里云开发者社区不拥有其著作权，亦不承担相应法律责任。具体规则请查看《阿里云开发者社区用户服务协议》和《阿里云开发者社区知识产权保护指引》。如果您发现本社区中有涉嫌抄袭的内容，填写侵权投诉表单进行举报，一经查实，本社区将立刻删除涉嫌侵权内容。

简介： ModelScope训练是指在ModelScope平台上对机器学习模型进行训练的活动；本合集将介绍ModelScope训练流程、模型优化技巧和训练过程中的常见问题解决方法。

问题一：在ModelScope刚才训练了一个epoch,想继续训练，该怎么办呢？直接这样两行代码即可继续训练

在ModelScope刚才训练了一个epoch,想继续训练，该怎么办呢？这样两行代码即可继续训练吗？

参考回答：

可以

关于本问题的更多回答可点击原文查看：https://developer.aliyun.com/ask/484251?spm=a2c6h.14164896.0.0.17f11edfskzLVz

问题二：ModelScope通过GPT-3中文2.7B模型在诗词生成数据集上二次开发训练

ModelScope通过GPT-3中文2.7B模型在诗词生成数据集上二次开发训练，训练出的模型预测时报这个，请问有解决方式吗，训练过程没报错，模型文件夹：

参考回答：

数据集准备：为了在GPT-3中文模型上进行二次开发和训练，首先需要准备一个高质量的诗词数据集。数据集应该包含大量标准化的诗词文本，且格式一致，方便模型学习。

环境设置：确保您有权访问ModelScope平台，并且已经设置了必要的开发环境，包括安装了所需的软件包和库。

模型加载：在ModelScope平台上加载GPT-3中文2.7B模型。通常，这可以通过ModelScope提供的API或者SDK来完成。

二次训练：在现有GPT-3中文模型的基础上，使用您准备的诗词数据集来进行二次训练。这通常涉及到设置训练参数，如学习率、批次大小、训练轮数等。

训练过程监控：在训练过程中，监控模型的性能，确保模型在学习过程中没有过拟合或者欠拟合。可以通过设置验证集来评估模型在训练过程中的表现。

优化和调整：根据模型在训练过程中的表现，可能需要对模型的架构或训练参数进行调整，以达到更好的效果。

测试和评估：用另一组数据进行测试，评估模型的诗词生成能力。可以使用诗词质量、创新性、韵律等标准来评价生成的诗词。

模型部署：一旦模型训练完成并通过测试，就可以部署模型，使其可以响应用户的请求进行诗词生成。

关于本问题的更多回答可点击原文查看：https://developer.aliyun.com/ask/493125?spm=a2c6h.14164896.0.0.17f11edfskzLVz

问题三：modelscope/ChineseText2SQL中提供的训练json数据的数据格式是什么?

modelscope/ChineseText2SQL中提供了如下的训练json数据，但没有给出其中字段的中文含义，能否提供一下其中各个字段的中文含义。

{
    "table_id": "excel_通用_google_1092607",
    "question": "男生彭胤的生源省市是哪里？",
    "action": [
        10
    ],
    "sql": {
        "agg": [
            0
        ],
        "sel": [
            3
        ],
        "cond_conn_op": 1,
        "conds": [
            [
                1,
                2,
                "彭方胤",
                "彭胤"
            ],
            [
                2,
                2,
                "男",
                "男生"
            ]
        ],
        "use_add_value": 0
    },
    "history_sql": null,
    "wvi_corenlp": [
        [
            2,
            3
        ],
        [
            0,
            1
        ]
    ],
    "question_tok": [
        "男",
        "生",
        "彭",
        "胤",
        "的",
        "生",
        "源",
        "省",
        "市",
        "是",
        "哪",
        "里",
        "？"
    ],
    "header_tok": [
        [
            "报",
            "名",
            "号"
        ],
        [
            "考",
            "生",
            "姓",
            "名"
        ],
        [
            "性",
            "别"
        ],
        [
            "生",
            "源",
            "省",
            "市"
        ],
        [
            "所",
            "在",
            "中",
            "学"
        ],
        [
            "考",
            "核",
            "资",
            "格",
            "大",
            "类"
        ],
        [
            "符",
            "合",
            "报",
            "名",
            "条",
            "件"
        ],
        [
            "空",
            "列"
        ]
    ],
    "bertindex_knowledge": [
        1,
        3,
        1,
        3,
        0,
        4,
        4,
        4,
        4,
        0,
        0,
        0,
        0
    ],
    "header_knowledge": [
        0,
        2,
        2,
        1,
        0,
        0,
        0
    ],
    "types": [
        "number",
        "text",
        "text",
        "text",
        "text",
        "text",
        "text",
        "null"
    ],
    "units": [
        [
            "null"
        ],
        [
            "null"
        ],
        [
            "null"
        ],
        [
            "null"
        ],
        [
            "null"
        ],
        [
            "null"
        ],
        [
            "null"
        ],
        [
            "null"
        ]
    ],
    "schema_link": [
        {
            "question_index": [
                0,
                1
            ],
            "column_index": 2,
            "label": "val"
        },
        {
            "question_index": [
                2,
                3
            ],
            "column_index": 1,
            "label": "val"
        },
        {
            "question_index": [
                5,
                8
            ],
            "column_index": 3,
            "label": "col"
        }
    ]
}

参考回答：

可以参考这个链接～

https://developer.aliyun.com/ask/488580?spm=a2c6h.13066369.question.7.3a766fc1DQZoXC

关于本问题的更多回答可点击原文查看：https://developer.aliyun.com/ask/491640?spm=a2c6h.14164896.0.0.17f11edfskzLVz

问题四：ModelScope中如何加载训到一半保存的checkpoint，接着训练吗？

ModelScope中如何加载训到一半保存的checkpoint，接着训练吗？升级1.3.2之后存储格式好像改了

参考回答：

用于继续训练 trainer.train(checkpoint_path=os.path.join(self.tmp_dir, 'iter_3.pth')) https://modelscope.cn/docs/%E6%A8%A1%E5%9E%8B%E7%9A%84%E8%AE%AD%E7%BB%83Train

关于本问题的更多回答可点击原文查看：https://developer.aliyun.com/ask/490756?spm=a2c6h.14164896.0.0.14c71edfP7EB3l

问题五：ModelScope stable duffusion支持训练与推理吗？

ModelScope stable duffusion支持训练与推理吗？

参考回答：

目前配置好可以在web端进行训练。

关于本问题的更多回答可点击原文查看：https://developer.aliyun.com/ask/485411?spm=a2c6h.14164896.0.0.14c71edfP7EB3l

ModelScope问题之加载训到一半保存的checkpoint接着训练如何解决

问题一：在ModelScope刚才训练了一个epoch,想继续训练，该怎么办呢？直接这样两行代码即可继续训练

问题二：ModelScope通过GPT-3中文2.7B模型在诗词生成数据集上二次开发训练

问题三：modelscope/ChineseText2SQL中提供的训练json数据的数据格式是什么?

问题四：ModelScope中如何加载训到一半保存的checkpoint，接着训练吗？

问题五：ModelScope stable duffusion支持训练与推理吗？

ModelScope模型即服务

热门文章

最新文章

相关课程

相关电子书