开发者社区> 问答> 正文

音频识别不准确该如何解决?

音频识别不准确该如何解决?

展开
收起
我是三好学生 2024-08-01 10:20:38 6 0
1 条回答
写回答
取消 提交回答
  • 如果频段信息不完整,可能会造成识别不准确,ASR模型的标准训练数据要求为频段完整的8K/16K采样率数据。

    建议确保频段信息完整的基础上,对识别不准确的地方使用自学习模型进行优化。

    如果使用了热词,业务专属热词的权重不宜过高,权重太高可能会引起语句被截断,导致后续语音无法进行识别。

    针对一般的识别错误,可以使用语音模型优化,将识别不佳的句子(非单个词)进行多复制几遍的操作。

    对于使用录音文件识别服务,如果是合轨数据造成识别不准确。

    image.png
    参考文档https://help.aliyun.com/zh/isi/developer-reference/speech-recognition-troubleshooting?spm=a2c4g.11186623.0.i54

    2024-08-02 09:28:13
    赞同 4 展开评论 打赏
问答地址:
问答排行榜
最热
最新

相关电子书

更多
低代码开发师(初级)实战教程 立即下载
冬季实战营第三期:MySQL数据库进阶实战 立即下载
阿里巴巴DevOps 最佳实践手册 立即下载