开发者社区> 问答> 正文

在阿里语音AI极速版的可以实现语音分轨吗?

问题一:在阿里语音AI极速版的可以实现语音分轨吗?我想知道每一句话是哪个人说的 两个人打电话,区分出两个人的声音
问题二: auto_split,这个字段我没有传,返回识别结果也能区分出来啊 两个人通话,有必要传这个字段吗?

展开
收起
乐天香橙派 2023-08-25 10:38:28 67 0
4 条回答
写回答
取消 提交回答
  • 北京阿里云ACE会长

    我已经认真阅读了 你的问题:

    【 在阿里语音AI极速版的可以实现语音分轨吗?

    并思考了

    建议如下:


    因此无法准确地区分两个人打电话时的语音。但是,如果您只需要将两个人的语音分离成不同的轨道,可以使用音频处理软件,如 Audacity 等,将音频文件导入软件中,然后使用软件中的“拆分”或“分离”功能将两个人的语音分离成不同的轨道。

    2023-08-26 13:55:54
    赞同 展开评论 打赏
  • 公众号:网络技术联盟站,InfoQ签约作者,阿里云社区签约作者,华为云 云享专家,BOSS直聘 创作王者,腾讯课堂创作领航员,博客+论坛:https://www.wljslmz.cn,工程师导航:https://www.wljslmz.com

    问题一:阿里语音AI极速版目前并不提供语音分轨的功能。该版本的语音识别服务主要用于将语音转换为文本,而不用于区分不同人的声音或进行语音分轨。

    问题二:在使用阿里云语音识别服务时,如果你处理的是两个人的通话音频,且希望将它们分开识别,可以使用auto_split字段。该字段用于告诉阿里云的语音识别服务在识别过程中自动检测和分隔说话人。

    通过设置auto_split = true,语音识别服务将尝试自动检测不同的说话人,并在返回结果中标记不同的说话人标识符。这样可以帮助你识别并区分出两个人在通话中的发言内容。

    如果你不传递auto_split字段,则默认情况下,语音识别服务会将整个音频作为一个语音流进行处理,而无法区分不同说话人的发言。

    2023-08-25 18:05:09
    赞同 展开评论 打赏
  • 针对问题一的回答:极速版没有角色分离的
    针对问题二的回答:极速版没有角色分离的 —此回答来自钉群”阿里语音AI【6群】“

    2023-08-25 11:00:30
    赞同 展开评论 打赏
  • CSDN全栈领域优质创作者,万粉博主;InfoQ签约博主;华为云享专家;华为Iot专家;亚马逊人工智能自动驾驶(大众组)吉尼斯世界纪录获得者

    1、是的,阿里语音AI极速版支持语音分轨功能,可以将一段录音按照不同的人的声音分成多个轨道,以便区分出每个人的声音。
    要实现语音分轨,您可以使用阿里语音AI极速版提供的语音识别API,将录音转换成文本,然后使用语音合成API将文本转换成语音。在调用语音合成API时,可以指定不同的发音和语速,以模拟不同人的声音。最后,将生成的多个语音轨道合并成一个音频文件即可。
    2、auto_split是阿里语音AI极速版的一个参数,用于控制语音识别是否自动分轨。如果您没有传递auto_split参数,阿里语音AI极速版仍然会将整段录音识别为一个完整的文本,然后使用语音合成API将文本转换成语音。
    如果您希望将录音按照不同的人的声音分成多个轨道,可以传递auto_split参数,并将其设置为True。这样,阿里语音AI极速版会自动检测录音中的语音段,并将其分割成多个轨道,以便区分出每个人的声音。

    2023-08-25 10:44:07
    赞同 展开评论 打赏
问答排行榜
最热
最新

相关电子书

更多
释放算力潜能,加速 AI 应用构建 立即下载
网易游戏机器学习云平台助力AI应用落地实践 立即下载
智算时代,基于 ACK 落地云原生AI 立即下载