开发者社区> 问答> 正文

我调用实时语音识别接口,传入参数:max_sentence_silence:700ms,但是语音只停

我调用实时语音识别接口,传入参数:max_sentence_silence:700ms,但是语音只停顿400多ms就被断句了,能否帮忙排查?

展开
收起
爱喝咖啡嘿 2023-01-05 16:03:57 1594 0
2 条回答
写回答
取消 提交回答
  • 这边看了下 你这个音频,那个停顿应该超过700ms以上了 确实会断句的。你这边如果不想断句太开,可以使用语义断句:enable_semantic_sentence_detection 2fea01b781a52aac8b398cb991a99359.png 8ad0d2127d4277f326d5baaf086ed467.png——该回答整理自钉群“阿里语音AI【5群】”

    2023-01-06 14:41:34
    赞同 展开评论 打赏
  • 根据您的描述,我们可以尝试从以下几个方面入手:

    确认语音文件的质量:请检查语音文件是否有杂音或噪声,或者是否存在录音不清晰的情况。这些情况可能会导致实时语音识别接口无法准确识别语音。

    确认 max_sentence_silence 参数的设置:请确认 max_sentence_silence 参数是否设置正确,并且是否与实际语音停顿时间相符。如果 max_sentence_silence 设置过小,可能会导致实时语音识别接口在语音停顿时间还没到达设置值的情况下就断句。

    确认调用接口的代码是否正常:请检查调用实时语音识别接口的代码是否有语法错误或

    其他问题,确保代码的正常运行。

    检查网络连接情况:请确认网络连接是否正常,并确保在调用实时语音识别接口时,网络带宽和网络延迟都达到了可接受的范围。如果网络连接不稳定,可能会导致语音识别结果不准确。

    希望以上内容能够帮助您解决问题,如果问题仍然存在,您可以尝试联系阿里云技术支持,他们将会给予您更加专业的帮助。

    2023-01-05 23:48:48
    赞同 展开评论 打赏
问答排行榜
最热
最新

相关电子书

更多
阿里云总监课第二期——Neural Network Language Model在语音识别中的应用 立即下载
阿里云总监课第二期——Latency Controlled-BLSTM模型在语音识别中的应用 立即下载
智能语音交互:阿里巴巴的研究与实践 立即下载