如果频段信息不完整,可能会造成识别不准确,ASR模型的标准训练数据要求为频段完整的8K/16K采样率数据。
建议确保频段信息完整的基础上,对识别不准确的地方使用自学习模型进行优化。
如果使用了热词,业务专属热词的权重不宜过高,权重太高可能会引起语句被截断,导致后续语音无法进行识别。
针对一般的识别错误,可以使用语音模型优化,将识别不佳的句子(非单个词)进行多复制几遍的操作。
对于使用录音文件识别服务,如果是合轨数据造成识别不准确。
版权声明:本文内容由阿里云实名注册用户自发贡献,版权归原作者所有,阿里云开发者社区不拥有其著作权,亦不承担相应法律责任。具体规则请查看《阿里云开发者社区用户服务协议》和《阿里云开发者社区知识产权保护指引》。如果您发现本社区中有涉嫌抄袭的内容,填写侵权投诉表单进行举报,一经查实,本社区将立刻删除涉嫌侵权内容。