开发者社区 > ModelScope模型即服务 > 正文

ModelScope这个模型怎么自定义路径?

import os
import tempfile
from modelscope.msdatasets import MsDataset
from modelscope.metainfo import Trainers
from modelscope.trainers import build_trainer

通过data_files参数传入list来批量加载

my_csv_1 = 'results/1.csv'
my_csv_2 = 'results/sam.csv'

训练数据的输入出均为文本,需要将数据集预处理为输入为 src_txt,输出为 tgt_txt 的格式:

train_dataset = MsDataset.load('csv', data_files=[my_csv_1]).remap_columns(
{'input_text': 'src_txt', 'category': 'tgt_txt'})
eval_dataset = MsDataset.load('csv', data_files=[my_csv_2]).remap_columns(
{'input_text': 'src_txt', 'category': 'tgt_txt'})

num_warmup_steps = 500

def noam_lambda(current_step: int):
current_step += 1
return min(current_step (-0.5), current_step * num_warmup_steps (-1.5))

可以在代码修改 configuration 的配置

def cfg_modify_fn(cfg):
cfg.train.lr_scheduler = {
'type': 'LambdaLR',
'lr_lambda': noam_lambda,
'options': {
'by_epoch': False
}
}
cfg.train.optimizer = {
"type": "AdamW",
"lr": 1e-3,
"options": {}
}
cfg.train.max_epochs = 1
cfg.train.dataloader = {
"batch_size_per_gpu": 1, # 减小 batch_size
"workers_per_gpu": 1
}
cfg.fp16 = {
'enabled': True # 启用混合精度训练
}
return cfg

if name == 'main':

# 指定模型导出路径
export_dir = 'F:/study/graduationProject/openingReport/exported_model'

kwargs = dict(
    model='F:/study/graduationProject/openingReport/nlp_mt5_zero-shot-augment_chinese-base',
    model_revision="master",
    train_dataset=train_dataset,
    eval_dataset=eval_dataset,
    work_dir=tempfile.TemporaryDirectory().name,
    cfg_modify_fn=cfg_modify_fn
)
trainer = build_trainer(
    name=Trainers.text_generation_trainer, default_args=kwargs)
trainer.train()

# 导出模型到指定位置
if not os.path.exists(export_dir):
    os.makedirs(export_dir)

# 确保 trainer.model 和 trainer.tokenizer 是正确的对象
if hasattr(trainer, 'model') and hasattr(trainer, 'tokenizer'):
    trainer.model.save_pretrained(export_dir)
    trainer.tokenizer.save_pretrained(export_dir)
    print(f"模型已导出到 {export_dir}")
else:
    print("无法找到模型或分词器对象进行保存")ModelScope这个模型怎么自定义路径?每次都保存在c盘

展开
收起
夹心789 2024-06-09 16:24:30 45 0
1 条回答
写回答
取消 提交回答
  • work_dir改一下 ,此回答整理自钉群“魔搭ModelScope开发者联盟群 ①”

    2024-06-11 09:42:49
    赞同 展开评论 打赏

ModelScope旨在打造下一代开源的模型即服务共享平台,为泛AI开发者提供灵活、易用、低成本的一站式模型服务产品,让模型应用更简单!欢迎加入技术交流群:微信公众号:魔搭ModelScope社区,钉钉群号:44837352

热门讨论

热门文章

相关电子书

更多
视觉AI能力的开放现状及ModelScope实战 立即下载
ModelScope助力语音AI模型创新与应用 立即下载
低代码开发师(初级)实战教程 立即下载