开发者社区 > ModelScope模型即服务 > 语音 > 正文

语音合成速度太慢,且无法并行

语音合成-中文-多情感领域(speech_sambert-hifigan_tts_zh-cn_16k)输出语音效果非常好,但是速度太慢,合成90个字的语音耗时约6秒(GPU为Tesla P100),查了合成语音时的GPU的使用率非常低,便将一句话切割成多段文字在多个线程中并行合成,耗时跟单线程几乎一样。又打算在每个线程中创建一个pipeline,想通过不同的pipeline去合成,却这在初始化时就失败了,会产生如下错误: init dict failed init dict wrong prepare tts engine failed text.cc: festival_Text_init festival_initialize() called more than once

请问有什么办法可大幅加快合成速度,或者可以并行合成? 谢谢

展开
收起
1925010725393368 2023-01-03 12:12:53 1558 0
3 条回答
写回答
取消 提交回答
  • 请问这个问题楼主解决了吗,我现在也遇到一样的问题

    2023-12-06 14:27:56
    赞同 展开评论 打赏
  • 我也遇到类似的问题,有解决吗

    2023-11-14 15:09:50
    赞同 展开评论 打赏
  • 请问在利用pipeline做推理的时候,怎么设置用GPU推理啊,是需要额外写什么参数吗?

    2023-01-11 21:22:44
    赞同 展开评论 打赏

包括语音识别、语音合成、语音唤醒、声学设计及信号处理、声纹识别、音频事件检测等多个领域

热门讨论

热门文章

相关电子书

更多
Lindorm AI 能力介绍 立即下载
2023云栖大会:PolarDB for AI 立即下载
2023云栖大会:Lindorm一站式AI数据平台实战 立即下载