modelscope的Sambert-Hifigan模型是tts本身确实是需要3秒多的时间吗?
之前的优化建议:speech_sambert-hifigan_tts_zh-cn_16k这个模型vocoder可以导出成onnx然后用tensorrt转换后推理,性能可以提升不少;另外对于am可以采用多个instance的方式来并行推理,可以考虑使用c++代码实现其内部部分网络的推理。 此回答整理自钉群“魔搭ModelScope开发者联盟群 ①”
ModelScope旨在打造下一代开源的模型即服务共享平台,为泛AI开发者提供灵活、易用、低成本的一站式模型服务产品,让模型应用更简单!欢迎加入技术交流群:微信公众号:魔搭ModelScope社区,钉钉群号:44837352