开发者社区> 问答> 正文

在使用阿里语音AI的语音识别时,遇到以下问题,不知道有没有什么办法可以解决

请教技术问题:在使用语音识别时,遇到:1、识别双声道的电话录音。左声道是主叫,右声道是被叫2、主叫开了外放,以致左声道既有主叫说的,又有被叫说的;而右声道只有被叫说的话3、按两个角色转文字之后的结果就有重复,如下图c7207f693e7d6ee368243d3b83395c8b.png
不知道有没有什么办法可以解决(如果转成单声道,靠ASR来区分角色,角色识别的准确性就不太好)

展开
收起
乐天香橙派 2023-12-01 09:55:40 93 0
2 条回答
写回答
取消 提交回答
  • 您好,阿里云智能语音交互提供了录音文件识别服务,这是一种针对已经录制完成的录音文件进行离线识别的服务。在处理双声道电话录音的识别问题时,您可以调整音频通道的处理方式来尝试解决。

    具体来说,阿里云智能语音交互的录音文件识别接口中,有一个参数"是否只识别首个声道",这个参数可以影响音频通道的处理方式。当它的值设置为true时,8k采样率的音频会被视为单声道进行处理,16k采样率的音频也会被视为单声道进行处理;当它的值保持为默认空或者false时,8k采样率和16k采样率的音频都会被当作双声道进行处理。

    因此,您可以尝试将此参数设置为true,让智能语音交互在识别双声道电话录音时,优先考虑首个声道(如左声道)的语音内容,从而减少由于两个角色说话重叠导致的转文字结果重复的问题。

    2023-12-02 16:46:50
    赞同 展开评论 打赏
  • 试一下回声抑制处理一下后再asr—此回答来自钉群“阿里语音AI【6群】”

    2023-12-01 11:04:16
    赞同 展开评论 打赏
问答排行榜
最热
最新

相关电子书

更多
释放算力潜能,加速 AI 应用构建 立即下载
网易游戏机器学习云平台助力AI应用落地实践 立即下载
智算时代,基于 ACK 落地云原生AI 立即下载