文档备案控制台

开发者社区 ModelScope模型即服务计算机视觉正文

ModelScope 如何让语音合成句子之间的停顿时间增加，用的是多情感这个模型？

ModelScope 如何让语音合成句子之间的停顿时间增加，用的是多情感这个模型？
iQEcAqNwbmcDAQTNBDEFzQIhBtoAI4QBpCEIiT4CqhK5jiJvutwN8PUDzwAAAYogPrQ7BM4AG61bBwAIAAoE.png_720x720q90.jpg

展开

收起

青城山下庄文杰 2023-08-25 15:38:27 313 版权

1 条回答

写回答

取消提交回答

Ð

modelscope的tts pipeline不支持break这个SSML tag，break停顿有几类，其中ttsfrd出来的seq序列每一行是一个语义停顿，你可以在每一行之间插入一个语义级别的停顿。在合成时候，#1以及#3的停顿是由模型预测的，你可以通过控制模型预测的时长来控制这些停顿。在我们公有云产品上，break这个SSML停顿是通过将文本根据break切分后合成完再加入静音后再拼接的方式实现的，你可以参考下。-此回答整理自钉群“魔搭ModelScope开发者联盟群 ①”

2023-08-29 15:38:48

赞同展开评论

相关问答

模型：语音合成-中文-多情感领域-16k-多发音人语速调节

397

1

0

请问modelscope上的语音合成模型可以流式输出吗？

267

1

0

语音合成模型，官方默认提示的模式是免费的还是收费的？

173

0

0

ModelScope中，语音合成大模型，需要用什么系统搭建？

151

2

0

阿里云语音AI 语音合成CosyVoice大模型支持流式输出吗？

543

1

0

ModelScope中，Sambert-Hifigan的语音合成，如何流式合成啊？

293

1

0

CSP语音合成模型在哪些方面相较于SAMBERT模型具有优势？

182

1

0

CSP语音合成模型中的chunk cache based decoder是如何工作的？

226

1

0

CSP语音合成模型是如何提高TTS的生成效果和流式推理高效性的？

226

1

0

请问modelscope的samberthifigan语音合成多人预训练24K，要怎么更换发音人？

281

1

0

ModelScope模型即服务

计算机视觉

包含图像分类、图像生成、人体人脸识别、动作识别、目标分割、视频生成、卡通画、视觉评价、三维视觉等多个领域

我要提问

相关文章

AI短剧/AI广告生成实战流程：阿里云百炼新上线的HappyHorse 1.1功能详解、参数调试、成本指南

AI 英语教育平台的开发

阿里云百炼全模型通用抵扣AI节省计划是什么？使用Token更省钱吗？

AI 技术在英语学习中的应用

2026年中AI圈观察：当"拼参数"不再是终点，企业的AI落地该看什么？

相关解决方案

更多

GLM-5.2：长任务时代开源旗舰模型

基于 Spark 和 PyTorch 的模型训练方案

OpenAI 重磅开源，快速部署GPT-OSS模型

模型蒸馏：让0.6B模型媲美235B模型

一键训练模型及部署GPU共享推理服务

热门讨论

热门文章

ModelScope下载速度慢怎么解决？

ModelScope中，模型下载默认路径在哪个路径？

com/action/joingroup?code=v1是什么意思

ModelScope中，灵积模型服务怎么看账单比如如何看我的免费token额度还剩下多少?

modelscope cache 环境变量是啥？

ModelScope镜像地址是什么？

如何下载modelscope模型？

在ModelScope中，下载模型时的ssl问题怎么解决？!

问了豆包，一开始说是因为app.py没有添加，但添加之后还是发布失败，求解答

ModelScope这个免费额度可以在哪里查询啊？

展开全部

video-subtitle-remover（VSR）--开源AI去字幕方案深度解析

Qwen2.5-VL：阿里通义千问最新开源视觉语言模型，能够理解超过1小时的长视频

CogVideoX-Flash：智谱首个免费AI视频生成模型，支持文生视频、图生视频，分辨率最高可达4K

video-analyzer：开源视频分析工具，支持提取视频关键帧、音频转录，自动生成视频详细描述

LHM：单图生成3D动画人！阿里开源建模核弹，高斯点云重构服装纹理

UI-TARS：字节跳动开源专注于多平台 GUI 自动化交互的视觉语言模型

RF-DETR：YOLO霸主地位不保？开源 SOTA 实时目标检测模型，比眨眼还快3倍！

X-AnyLabeling：开源的 AI 图像标注工具，支持多种标注样式，适于目标检测、图像分割等不同场景

极致的显存管理！6G显存运行混元Video模型

LTX Video：Lightricks推出的开源AI视频生成模型

展开全部

还有其他疑问?