开发者社区 > ModelScope模型即服务 > 语音 > 正文

语音合成速度太慢,且无法并行

语音合成-中文-多情感领域(speech_sambert-hifigan_tts_zh-cn_16k)输出语音效果非常好,但是速度太慢,合成90个字的语音耗时约6秒(GPU为Tesla P100),查了合成语音时的GPU的使用率非常低,便将一句话切割成多段文字在多个线程中并行合成,耗时跟单线程几乎一样。又打算在每个线程中创建一个pipeline,想通过不同的pipeline去合成,却这在初始化时就失败了,会产生如下错误: init dict failed init dict wrong prepare tts engine failed text.cc: festival_Text_init festival_initialize() called more than once

请问有什么办法可大幅加快合成速度,或者可以并行合成? 谢谢

展开
收起
1925010725393368 2023-01-03 12:12:53 1450 0
3 条回答
写回答
取消 提交回答
  • 请问这个问题楼主解决了吗,我现在也遇到一样的问题

    2023-12-06 14:27:56
    赞同 展开评论 打赏
  • 我也遇到类似的问题,有解决吗

    2023-11-14 15:09:50
    赞同 展开评论 打赏
  • 请问在利用pipeline做推理的时候,怎么设置用GPU推理啊,是需要额外写什么参数吗?

    2023-01-11 21:22:44
    赞同 展开评论 打赏

包括语音识别、语音合成、语音唤醒、声学设计及信号处理、声纹识别、音频事件检测等多个领域

相关电子书

更多
Data+AI时代大数据平台应该如何建设 立即下载
大数据AI一体化的解读 立即下载
当搜索遇见AI 立即下载