ProsoSpeech模型是如何解决现有韵律建模方法中存在的问题的?
ProsoSpeech模型通过引入音素编码网络、词编码网络、长度规整模块、解码网络、韵律编码网络和隐藏韵律矢量预测网络,实现了对基频、能量和时长等韵律成分的联合建模,解决了基频提取不准、韵律成分间关联性不足以及TTS数据对多样韵律分布建模不足的问题。
版权声明:本文内容由阿里云实名注册用户自发贡献,版权归原作者所有,阿里云开发者社区不拥有其著作权,亦不承担相应法律责任。具体规则请查看《阿里云开发者社区用户服务协议》和《阿里云开发者社区知识产权保护指引》。如果您发现本社区中有涉嫌抄袭的内容,填写侵权投诉表单进行举报,一经查实,本社区将立刻删除涉嫌侵权内容。