开发者社区> 问答> 正文

在用阿里云语音AI TTS服务的时候,合成的语音结尾都有一段空白,有什么参数可以去掉吗?

在用阿里云语音AI TTS服务的时候,合成的语音结尾都有一段空白,有什么参数可以去掉吗?
832c046bcb4b9f07519684e51ad32ec2.png

展开
收起
2401。 2023-07-30 14:59:56 254 0
3 条回答
写回答
取消 提交回答
  • 这个是工具的问题吧? 您用电脑自带的播放器听一下应该是没有问题的。我这边用Adobe Audition CS6、Audacity、ocenaudio这是三个工具看了一下都是正常的。听起来也是没问题的。这个位置的空白只有75ms。在合成的过程中这个静音不能省略,会影响听感的。如果您不想要句尾的静音可以写代码处理一下这个音频就行了。目前语音合成不支持这个操作。
    此回答整理自钉群“阿里语音AI【5群】”。

    2023-08-01 12:10:19
    赞同 展开评论 打赏
  • 北京阿里云ACE会长

    以尝试使用以下参数来调整语音合成的效果,以去掉结尾的空白:

    设置"silence_time"参数
    该参数用于控制语音合成的静默时间,即在语音结束后,TTS引擎会保持静默一段时间,以便听者能够完全听到整个语音内容。您可以通过设置该参数的值来调整静默时间,例如将其设置为0,即可去掉结尾的空白。示例代码如下:

    Copy
    request.set_silence_time(0)
    设置"speech_rate"参数
    该参数用于控制语音合成的语速,即控制TTS引擎合成语音的速度。您可以通过适当调整该参数的值来改变语音合成的速度和长度,从而达到去掉结尾空白的效果。示例代码如下:

    Copy
    request.set_speech_rate(0.8)

    2023-07-31 22:44:02
    赞同 展开评论 打赏
  • 在使用阿里云语音AI的TTS服务时,合成的语音结尾出现空白问题可能与参数设置有关。您可以尝试调整以下两个参数来减少或去掉结尾的空白部分:

    1. SilenceTime(静音时间):这个参数表示合成语音末尾的静默时间长度。您可以尝试将其设置为较小的值,以减少最后的静默时间。默认值为500毫秒,您可以根据需要适当调整,例如设置为100毫秒。

    2. Tone(音调):通过在合成请求中指定一个较高的音调,可以尝试加快语音结束部分的节奏。默认值是0,表示标准音调。您可以尝试将其设置为正数(如1、2、3等),以加快音频节奏。

    请注意,具体的参数设置可能会因阿里云语音AI的版本和配置而有所不同。建议您查阅阿里云语音AI的文档或咨询其官方支持团队,获取更准确和详细的参数设置指南。

    2023-07-30 21:04:16
    赞同 展开评论 打赏
问答排行榜
最热
最新

相关电子书

更多
释放算力潜能,加速 AI 应用构建 立即下载
网易游戏机器学习云平台助力AI应用落地实践 立即下载
智算时代,基于 ACK 落地云原生AI 立即下载