modelscope-funasr这种情况除了增加训练数据,还有什么解决方法?

目前我们在微调“Paraformer语音识别-中文-通用-16k-实时-large-onnx”这个模型。数据量比较少,只有几个小时。训练了50个epoch,lr=0.001。但是训练之后,模型出现了重复字的现象。比如“你是谁”识别成了“你是是是是是谁谁谁”。modelscope-funasr这种情况除了增加训练数据,还有什么解决方法?不太明白为什么会出现这种重复字的情况

展开
收起
三分钟热度的鱼 2024-07-17 23:27:42 104 分享 版权
1 条回答
写回答
取消 提交回答
  • 数据不对 此回答整理自钉群“modelscope-funasr社区交流”

    2024-07-18 08:53:31
    赞同 10 展开评论

包含命名实体识别、文本分类、分词、关系抽取、问答、推理、文本摘要、情感分析、机器翻译等多个领域

热门讨论

热门文章

还有其他疑问?
咨询AI助理