在阿里语音AI中,目前就是一句话合成的需求,但是返回有时候比较慢,十几个字,需要花费将近2秒,这个是正常的吗?我们用于电话端的对话,对实时性要求很高,如果是文字比较长的一段后,得花5秒的时间,太影响使用了。
这个案例倒是没看到,我看到的是20个字大概300到700ms左右的时间,这个时间是正常的,如果咱们单次输入的文本信息比较多,并且可能是多次输入的这种场景,可以考虑使用流式tts文本语音合成的接口,类似一问一答这样的场景比较适合,可以边输入文本边生成语音直接播放给用户。此回答整理自钉群"阿里语音AI【6群】"
版权声明:本文内容由阿里云实名注册用户自发贡献,版权归原作者所有,阿里云开发者社区不拥有其著作权,亦不承担相应法律责任。具体规则请查看《阿里云开发者社区用户服务协议》和《阿里云开发者社区知识产权保护指引》。如果您发现本社区中有涉嫌抄袭的内容,填写侵权投诉表单进行举报,一经查实,本社区将立刻删除涉嫌侵权内容。