模型默认的configuration文件里面学习率给的是1,这是不是太大了?
这个模型一般loss训练到多少才算可以?
model_scope[版本1.1.0]提供的tensorboard的hook,在configuration文件里面配置并不生效,没有生成tfevent文件
csanmt在训练的时候也没有生成pth文件,和model_scope文档中关于【模型保存的配置】描述不符https://modelscope.cn/docs/%E6%A8%A1%E5%9E%8B%E7%9A%84%E8%AE%AD%E7%BB%83Train
您好,针对您的几个问题反馈如下: (1)模型默认的configuration文件里面学习率不是1.0,1.0只是学习率的缩放系数,参考:https://modelscope.cn/models/damo/nlp_csanmt_translation_en2zh/summary 【参数配置】部分的注释。 (2)您可以在验证集上选择最优的checkpoint,对于 Transformer模型来讲,loss只是用来参考模型训练过程的收敛性和稳定性。 (3)CSANMT基于tensorflow实现,会在本地目录下产生checkpoint文件和tfevents文件,不会生成pth文件。