csanmt的finetune相关配置问题
您好,针对您的几个问题反馈如下: (1)模型默认的configuration文件里面学习率不是1.0,1.0只是学习率的缩放系数,参考:https://modelscope.cn/models/damo/nlp_csanmt_translation_en2zh/summary 【参数配置】部分的注释。 (2)您可以在验证集上选择最优的checkpoint,对于 Transformer模型来讲,loss只是用来参考模型训练过程的收敛性和稳定性。 (3)CSANMT基于tensorflow实现,会在本地目录下产生checkpoint文件和tfevents文件,不会生成pth文件。
赞0
踩0