数据集 原来是1.jsonl 2.jsonl,使用续训 增加了 3.jsonl 4.jsonl 5.jsonl , 起来直接就进入到53%了 而且Train: 53%|█████▎ | 13866/26190 [27:17<16:55:18, 4.94s/it] 而且还会提示 best_model modelscope的问题怎么处理?
根据您提供的信息,数据集在续训过程中增加了新的文件(3.jsonl、4.jsonl 和 5.jsonl),并且训练进度直接跳到了 53%。这种情况可能与以下几个因素有关:
续训(Continual Pre-Training 或 Fine-Tuning)通常会基于之前训练的模型权重和状态继续训练。如果新增的数据集文件(如 3.jsonl、4.jsonl 和 5.jsonl)被正确加载到训练流程中,系统可能会重新计算总训练数据量,并将之前的训练进度合并到当前进度中。
训练进度条显示 Train: 53%|█████▎ | 13866/26190 [27:17]
,这表明当前已处理了 13866 条样本,总样本数为 26190。新增的 JSONL 文件可能显著增加了总数据量,从而导致进度百分比的变化。
当前进度 = 已处理样本数 / 总样本数
如果新增数据文件包含大量样本,总样本数会增加,而之前已完成的样本数占比会相应减少。
在续训过程中,系统可能会对新增数据进行预处理(如分词、向量化等),并将结果缓存以加速后续训练。如果预处理阶段已经完成部分工作,系统可能会直接跳过这些步骤并更新训练进度。
续训时,训练配置(如学习率、批次大小、优化器状态等)可能会影响训练进度的计算方式。如果新增数据文件较大,系统可能会自动调整训练参数以适应新的数据规模。
如果上述检查均无误,但仍出现进度异常,可能是以下原因导致的:
如果问题仍未解决,请提供更多详细信息(如 JSONL 文件样例、训练配置文件及日志内容),以便进一步分析。
ModelScope旨在打造下一代开源的模型即服务共享平台,为泛AI开发者提供灵活、易用、低成本的一站式模型服务产品,让模型应用更简单!欢迎加入技术交流群:微信公众号:魔搭ModelScope社区,钉钉群号:44837352