使用fp16半精度进行微调时,为啥 loss直接就为nan

使用fp16半精度进行微调时,为啥 loss直接就为nan

图片.png

展开
收起
萧瑟的味道 2023-03-14 19:58:15 832 分享 版权
1 条回答
写回答
取消 提交回答
  • 您好,您使用的是哪个模型呢

    2023-03-22 22:42:16
    赞同 展开评论

包含命名实体识别、文本分类、分词、关系抽取、问答、推理、文本摘要、情感分析、机器翻译等多个领域

热门讨论

热门文章

还有其他疑问?
咨询AI助理