在使用阿里语音AI的语音识别时，遇到以下问题，不知道有没有什么办法可以解决

请教技术问题：在使用语音识别时，遇到：1、识别双声道的电话录音。左声道是主叫，右声道是被叫2、主叫开了外放，以致左声道既有主叫说的，又有被叫说的；而右声道只有被叫说的话3、按两个角色转文字之后的结果就有重复，如下图
不知道有没有什么办法可以解决（如果转成单声道，靠ASR来区分角色，角色识别的准确性就不太好）

展开

收起

乐天香橙派 2023-12-01 09:55:40 400 版权

2 条回答

写回答

取消提交回答

sunrr

您好，阿里云智能语音交互提供了录音文件识别服务，这是一种针对已经录制完成的录音文件进行离线识别的服务。在处理双声道电话录音的识别问题时，您可以调整音频通道的处理方式来尝试解决。

具体来说，阿里云智能语音交互的录音文件识别接口中，有一个参数"是否只识别首个声道"，这个参数可以影响音频通道的处理方式。当它的值设置为true时，8k采样率的音频会被视为单声道进行处理，16k采样率的音频也会被视为单声道进行处理；当它的值保持为默认空或者false时，8k采样率和16k采样率的音频都会被当作双声道进行处理。

因此，您可以尝试将此参数设置为true，让智能语音交互在识别双声道电话录音时，优先考虑首个声道（如左声道）的语音内容，从而减少由于两个角色说话重叠导致的转文字结果重复的问题。

2023-12-02 16:46:50

赞同展开评论
一颗橙子11111

试一下回声抑制处理一下后再asr—此回答来自钉群“阿里语音AI【6群】”

2023-12-01 11:04:16

赞同展开评论

在使用阿里语音AI的语音识别时，遇到以下问题，不知道有没有什么办法可以解决

相关文章

相关解决方案

探索云世界

热门

云计算

大数据

云原生

人工智能

数据库

开发与运维

活动广场

任务中心

训练营

直播

乘风者计划

下载

镜像站

技术资料

在使用阿里语音AI的语音识别时，遇到以下问题，不知道有没有什么办法可以解决

相关文章

相关解决方案