开发者社区> 问答> 正文

请问一下智能语音交互、语音AI,我在调用实时语音识别测试时,边上有些噪音,但是没有说话,会识别出嗯嗯

请问一下智能语音交互、语音AI,我在调用实时语音识别测试时,边上有些噪音,但是没有说话,会识别出嗯嗯之类的词,如果要改speech_noise_threshold这个参数,一般要设置成多少呀?我感觉调了几个参数,感觉没什么效果,除了调这个参数,还能怎么做能够解决这个噪音出字的问题,有音频,和识别结果,没有taskid可以吗,这个音频被识别成“对”,16k的,我还有一个问题,如果我想要模型对一些句子的识别率比较高,我的热词里面可以直接加句子吗?实时的

展开
收起
真的很搞笑 2023-05-03 21:39:42 141 0
1 条回答
写回答
取消 提交回答
  • 噪音参数阈值,参数范围:[-1,1]。取值说明如下:

    取值越趋于-1,噪音被判定为语音的概率越大。

    取值越趋于+1,语音被判定为噪音的概率越大。有具体的音频和taskid吗,是说这个识别出字了是吗?用的是16k还是8k的模型,热词是不超过10个字的 建议可以热词+语言模型来优化,你这边调用的是什么链路呢?是实时还是录音文件啊,我看你这个case通过调整那个参数是有效果的 建议你这边多收集一些case,然后来调整那个参数,看对效果影响大不大的,此回答整理自钉群“阿里语音AI【3群】”

    2023-05-03 21:45:19
    赞同 展开评论 打赏
问答排行榜
最热
最新

相关电子书

更多
Data+AI时代大数据平台应该如何建设 立即下载
大数据AI一体化的解读 立即下载
当搜索遇见AI 立即下载