模型默认的configuration文件里面学习率给的是1,这是不是太大了?
这个模型一般loss训练到多少才算可以?
model_scope[版本1.1.0]提供的tensorboard的hook,在configuration文件里面配置并不生效,没有生成tfevent文件
csanmt在训练的时候也没有生成pth文件,和model_scope文档中关于【模型保存的配置】描述不符https://modelscope.cn/docs/%E6%A8%A1%E5%9E%8B%E7%9A%84%E8%AE%AD%E7%BB%83Train
学习率
默认情况下,模型的学习率设置为 1 可能确实有点大,特别是对于较小的数据集或复杂的模型。学习率过大会导致模型在训练过程中不稳定或发散。
对于大多数计算机视觉任务,建议的学习率范围通常在 0.001 到 0.1 之间。你可以从较小的学习率开始,例如 0.01,然后根据训练过程中的表现逐步增加。
损失函数
模型训练到什么程度才算“可以”取决于具体的任务和数据集。然而,对于一般的图像分类任务,你可以将以下损失值作为参考:
交叉熵损失:小于 0.1 通常被认为是好的。
均方误差 (MSE):小于 0.01 通常被认为是好的。
版权声明:本文内容由阿里云实名注册用户自发贡献,版权归原作者所有,阿里云开发者社区不拥有其著作权,亦不承担相应法律责任。具体规则请查看《阿里云开发者社区用户服务协议》和《阿里云开发者社区知识产权保护指引》。如果您发现本社区中有涉嫌抄袭的内容,填写侵权投诉表单进行举报,一经查实,本社区将立刻删除涉嫌侵权内容。