开发者社区 > ModelScope模型即服务 > 计算机视觉 > 正文

ModelScope 如何让语音合成句子之间的停顿时间增加,用的是多情感这个模型?

ModelScope 如何让语音合成句子之间的停顿时间增加,用的是多情感这个模型?
iQEcAqNwbmcDAQTNBDEFzQIhBtoAI4QBpCEIiT4CqhK5jiJvutwN8PUDzwAAAYogPrQ7BM4AG61bBwAIAAoE.png_720x720q90.jpg

展开
收起
青城山下庄文杰 2023-08-25 15:38:27 151 0
1 条回答
写回答
取消 提交回答
  • modelscope的tts pipeline不支持break这个SSML tag,break停顿有几类,其中ttsfrd出来的seq序列每一行是一个语义停顿,你可以在每一行之间插入一个语义级别的停顿。在合成时候,#1以及#3的停顿是由模型预测的,你可以通过控制模型预测的时长来控制这些停顿。在我们公有云产品上,break这个SSML停顿是通过将文本根据break切分后合成完再加入静音后再拼接的方式实现的,你可以参考下。-此回答整理自钉群“魔搭ModelScope开发者联盟群 ①”

    2023-08-29 15:38:48
    赞同 展开评论 打赏

包含图像分类、图像生成、人体人脸识别、动作识别、目标分割、视频生成、卡通画、视觉评价、三维视觉等多个领域

相关电子书

更多
视觉AI能力的开放现状及ModelScope实战 立即下载
ModelScope助力语音AI模型创新与应用 立即下载
低代码开发师(初级)实战教程 立即下载