开发者社区 > ModelScope模型即服务 > 语音 > 正文

我在使用Paraformer-large-热词版模型感觉效果不明显,有哪些参数可以设置吗?

原始的语音转文字是“呃,尊敬的各位投资者,下面我呢代表金盛基电跟大家介绍一下我们二零二二年这个业绩的情况。呃,先简单介绍我们公司,我们公司是二零零六年成立的,是上市,是二零一二年上市,”其中里面的公司名称“晶盛机电”被转成了错误的“金盛基电”,我尝试使用Paraformer-large-热词版模型,并添加hotword,param_dict['hotword'] = "晶盛机电 坩埚",但是输出的结果为“呃尊敬的各位投资者下面我呢代表金盛机电跟大家介绍一下我们二零二二年这个业绩的情况我们现单介绍我们公司我们公司是二零零六年成立的是上市是二零一二年上市”,其中原始的”基电“成功转成”机电“,但是”金盛“两个字没有被修正,请问有什么参数设置可以提升热词自定义的效果吗?或者有别的解决方案,可以将”金盛基电“正确替换成”晶盛机电“吗?

展开
收起
jeoafnsjhphqc 2023-06-16 15:52:58 341 0
2 条回答
写回答
取消 提交回答
  • 北京阿里云ACE会长

    更新的速度,过大或过小的学习率都可能会导致模型效果不佳。如果您的模型在训练过程中出现了梯度爆炸或者梯度消失的问题,可以尝试调整学习率的大小。通常情况下,较小的学习率可以帮助模型更好地收敛,但是会增加训练时间。

    批量大小(batch size):批量大小控制了模型一次更新所使用的样本数量,过大的批量大小可能会导致模型出现过拟合,过小的批量大小可能会导致模型收敛不稳定。您可以尝试不同的批量大小,选择最优的批量大小进行训练。

    训练轮数(epochs):训练轮数控制了模型训练的时长,过少的训练轮数可能会导致模型欠拟合,过多的训练轮数可能会导致模型过拟合。通常情况下,较大的模型需要更多的训练轮数才能得到更好的效果。

    正则化(regularization):正则化技术可以帮助模型减少过拟合的问题。您可以尝试使用 L1 正则化、L2 正则化或者 Dropout 等技术来约束模型的复杂度。

    2023-07-10 18:21:14
    赞同 展开评论 打赏
  • 您好,当前热词采用的是模型方案,暂时不支持参数设置来增加热词召回率,后面会支持传统fst热词方案,可以手动增加热词召回率。目前您可以通过finetune模型来增加晶盛机电等词汇的召回率,数据可以人工标注,或者tts合成。 欢迎加入钉钉用户群沟通您遇到的问题: dingding.jpg

    2023-06-26 15:36:31
    赞同 展开评论 打赏

包括语音识别、语音合成、语音唤醒、声学设计及信号处理、声纹识别、音频事件检测等多个领域

相关电子书

更多
低代码开发师(初级)实战教程 立即下载
冬季实战营第三期:MySQL数据库进阶实战 立即下载
阿里巴巴DevOps 最佳实践手册 立即下载