备案控制台

开发者社区 > ModelScope模型即服务 > 正文

您好，请教下ModelScope训练nlp_gpt3_text-generation_1.3B模型增

您好，请教下ModelScope训练nlp_gpt3_text-generation_1.3B模型增大数据集与测试集后出现如下报错。这个该如何解决呢？ RuntimeError: The expanded size of the tensor (541) must match the existing size (511) at non-singleton dimension 3. Target sizes: [1, 32, 511, 541]. Tensor sizes: [1, 1, 511, 511] 这个是训练代码哈 from modelscope.msdatasets import MsDataset from modelscope.trainers import build_trainer from modelscope.metainfo import Trainers from datasets import load_dataset import sys sys.setrecursionlimit(4000)

data_files = {"train": "train.csv", "test": "test.csv"}

dataset = load_dataset("csv", data_files=data_files, delimiter=",") dataset = MsDataset(dataset) train_dataset = MsDataset(dataset['train']).remap_columns({'text1': 'src_txt', 'text2': 'tgt_txt'})
.map(lambda example: {'src_txt': example['src_txt'] + '\n'}) eval_dataset = MsDataset(dataset['test']).remap_columns({'text1': 'src_txt', 'text2': 'tgt_txt'})
.map(lambda example: {'src_txt': example['src_txt'] + '\n'})

max_epochs = 10

tmp_dir = './gpt3_dureader'

num_warmup_steps = 200

def noam_lambda(current_step: int): current_step += 1 return min(current_step**(-0.5), current_step * num_warmup_steps**(-1.5))

def cfg_modify_fn(cfg): cfg.train.lr_scheduler = { 'type': 'LambdaLR', 'lr_lambda': noam_lambda, 'options': { 'by_epoch': False } } cfg.train.optimizer = {'type': 'AdamW', 'lr': 3e-4} cfg.train.dataloader = { 'batch_size_per_gpu': 2, 'workers_per_gpu': 1 } cfg.train.hooks.append({ 'type': 'MegatronHook' }) cfg.preprocessor.sequence_length = 512 cfg.model.checkpoint_model_parallel_size = 1 return cfg

kwargs = dict( model='./models/damo/nlp_gpt3_text-generation_1.3B', train_dataset=train_dataset, eval_dataset=eval_dataset, max_epochs=max_epochs, work_dir=tmp_dir, cfg_modify_fn=cfg_modify_fn)

trainer = build_trainer( name=Trainers.gpt3_trainer, default_args=kwargs) trainer.train()

展开

收起

真的很搞笑 2023-05-02 07:46:40 143 0

0 条回答

写回答

取消提交回答

相关问答

安装验证，pip install modelscope[nlp] 报错

89

0

0

modelscope必须大于等于3.8才可以成功安装scope【nlp吗？

39

2

0

在安装modelscope[nlp]的时候遇到报错怎么解决？

38

1

0

modelscope训练完一直出现同一个错误怎么回事？

38

1

0

NLP自学习平台像这样训练完成的模型发布不了一直显示加速中，取消发布显示部署失败是怎么回事呢？

39

0

0

NLP自学习平台在训练文本实体抽取的模型时训练失败了，训练日志报错是这样，怎么解决？

41

1

0

ModelScope 使用mossformer的训练代码出现如下报错，该如何解决啊？

31

1

0

通过这个ModelScope去添加一个数据集去训练一下不知道是否推荐？

29

1

0

ModelScope的swift能训练llama3.1的大模型吗？

34

1

0

想在PAI平台里离线调用NLP模型，发现平台不支持比较高的ModelScope版本，要怎么解决呢？

39

1

0

ModelScope模型即服务

ModelScope旨在打造下一代开源的模型即服务共享平台，为泛AI开发者提供灵活、易用、低成本的一站式模型服务产品，让模型应用更简单！欢迎加入技术交流群：微信公众号：魔搭ModelScope社区，钉钉群号：44837352

我要提问

相关产品

自然语言处理

文档详情产品详情

热门讨论

热门文章

ModelScope qwen7b、14b、72b lora微调分别需要的显存和cpu内存是多少？

modelscope-funasr的FunClip怎么安装的？

ModelScope中，模型下载默认路径在哪个路径？

小白求助，跟着大模型微调教程做不太明白

com/action/joingroup?code=v1是什么意思

ModelScope默认的下载位置是在哪里？

ModelScope有部署qwen2-72b的么，正常推理需要多大的显存？

我希望通过damo-YOLO训练1500*1500的图片

服务器上onnxruntime-gpu 调用结束，如何释放显存

无法导入 modelscope，已经pip install了

展开全部

阿里云通义千问向全社会开放！

智胜未来：国内大模型+Agent应用案例精选，以及主流Agent框架开源项目推荐

multi-agent：多角色Agent协同合作，高效完成复杂任务

Llama 3开源，魔搭社区手把手带你推理，部署，微调和评估

ModelScope一键部署模型：新手村实操FAQ篇

自然语言处理Transformer模型最详细讲解（图解版）

通义千问72B、1.8B、Audio模型开源！魔搭社区最佳实践来啦！

大模型时代，还缺一只雨燕｜ SWIFT：魔搭社区轻量级微调推理框架

“魔搭”来了！一文深度解读达摩院推出的AI模型社区

TripoSR开源！从单个图像快速生成 3D 对象！（附魔搭社区推理实战教程）

展开全部

相关课程

更多

个性化语音合成模型微调

252

1

去学习

ModelScope社区Library技术架构介绍

227

1

去学习

达摩院NLP（自然语言处理）技术和应用

3172

7

去学习

达摩院自然语言处理NLP技术和应用

878

7

去学习

相关电子书

更多

自然语言处理得十个发展趋势 立即下载

自然语言处理的十个发展趋势 立即下载

深度学习与自然语言处理 立即下载

相关实验场景

更多