请问一下智能语音交互、语音AI,我在调用实时语音识别测试时,边上有些噪音,但是没有说话,会识别出嗯嗯之类的词,如果要改speech_noise_threshold这个参数,一般要设置成多少呀?我感觉调了几个参数,感觉没什么效果,除了调这个参数,还能怎么做能够解决这个噪音出字的问题,有音频,和识别结果,没有taskid可以吗,这个音频被识别成“对”,16k的,我还有一个问题,如果我想要模型对一些句子的识别率比较高,我的热词里面可以直接加句子吗?实时的
噪音参数阈值,参数范围:[-1,1]。取值说明如下:
取值越趋于-1,噪音被判定为语音的概率越大。
取值越趋于+1,语音被判定为噪音的概率越大。有具体的音频和taskid吗,是说这个识别出字了是吗?用的是16k还是8k的模型,热词是不超过10个字的 建议可以热词+语言模型来优化,你这边调用的是什么链路呢?是实时还是录音文件啊,我看你这个case通过调整那个参数是有效果的 建议你这边多收集一些case,然后来调整那个参数,看对效果影响大不大的,此回答整理自钉群“阿里语音AI【3群】”
版权声明:本文内容由阿里云实名注册用户自发贡献,版权归原作者所有,阿里云开发者社区不拥有其著作权,亦不承担相应法律责任。具体规则请查看《阿里云开发者社区用户服务协议》和《阿里云开发者社区知识产权保护指引》。如果您发现本社区中有涉嫌抄袭的内容,填写侵权投诉表单进行举报,一经查实,本社区将立刻删除涉嫌侵权内容。