开发者社区 > ModelScope模型即服务 > 自然语言处理 > 正文

csanmt的finetune相关配置问题

模型默认的configuration文件里面学习率给的是1,这是不是太大了?

这个模型一般loss训练到多少才算可以?

model_scope[版本1.1.0]提供的tensorboard的hook,在configuration文件里面配置并不生效,没有生成tfevent文件

csanmt在训练的时候也没有生成pth文件,和model_scope文档中关于【模型保存的配置】描述不符https://modelscope.cn/docs/%E6%A8%A1%E5%9E%8B%E7%9A%84%E8%AE%AD%E7%BB%83Train

展开
收起
p4pdqdl5ikygk 2022-12-08 23:32:30 716 0
1 条回答
写回答
取消 提交回答
  • 您好,针对您的几个问题反馈如下: (1)模型默认的configuration文件里面学习率不是1.0,1.0只是学习率的缩放系数,参考:https://modelscope.cn/models/damo/nlp_csanmt_translation_en2zh/summary 【参数配置】部分的注释。 (2)您可以在验证集上选择最优的checkpoint,对于 Transformer模型来讲,loss只是用来参考模型训练过程的收敛性和稳定性。 (3)CSANMT基于tensorflow实现,会在本地目录下产生checkpoint文件和tfevents文件,不会生成pth文件。

    2022-12-15 11:52:17
    赞同 展开评论 打赏

包含命名实体识别、文本分类、分词、关系抽取、问答、推理、文本摘要、情感分析、机器翻译等多个领域

热门讨论

热门文章

相关电子书

更多
低代码开发师(初级)实战教程 立即下载
冬季实战营第三期:MySQL数据库进阶实战 立即下载
阿里巴巴DevOps 最佳实践手册 立即下载