有人用ModelScope 的SambertHifigan个性化语音合成-中文-预训练-16k 做语音定制吗
是的,有人使用 ModelScope 的 SambertHifigan个性化语音合成-中文-预训练-16k 模型进行语音定制。以下是关于如何使用该模型进行语音定制的详细说明:
SambertHifigan个性化语音合成-中文-预训练-16k 是一种基于 Sambert 和 Hifigan 技术的语音合成模型,支持中英文双语合成,并且具备高质量的语音输出能力。该模型适用于多种场景,包括但不限于新闻播报、配音解说、客服对话等。
根据知识库中的资料,用户可以通过以下步骤完成个性化语音定制:
系统会自动训练个性化声音模型,训练成功后,您可以在手机端或控制台试听合成效果。
注意: - 定制的个性化声音模型会与项目绑定,删除项目会导致模型无法调用,请谨慎操作。 - 新开通服务的用户可在 3 个月内免费试用,试用期过后需升级为商用版以继续使用。
voice
参数中。示例代码如下:
synthesizer.setVoice("${模型调用ID}");
如果需要通过 WebSocket 连接访问 Sambert 语音合成服务,可以参考以下消息格式发送请求:
{
"header": {
"action": "run-task",
"task_id": "2bf83b9a-baeb-4fda-8d9a-xxxxxxxxxxxx",
"streaming": "out"
},
"payload": {
"model": "sambert-zhichu-v1",
"task_group": "audio",
"task": "tts",
"function": "SpeechSynthesizer",
"input": {
"text": "床前明月光," // 待合成文本
},
"parameters": {
"text_type": "PlainText",
"format": "mp3", // 音频格式
"sample_rate": 16000, // 采样率
"volume": 50, // 音量
"rate": 1, // 语速
"pitch": 1, // 音调
"word_timestamp_enabled": true, // 是否开启词时间戳
"phoneme_timestamp_enabled": true // 是否开启音素时间戳
}
}
}
此方式适用于需要流式输出的场景,例如虚拟数字人实时语音合成。
根据知识库中的信息,SambertHifigan个性化语音合成-中文-预训练-16k 模型特别适合以下场景: - 新闻播报:如知达(知达男声)、知佳(标准女声)等音色。 - 配音解说:如知伦(悬疑解说)、知飞(激昂解说)等音色。 - 客服对话:如知悦(温柔女声)、Betty(客服女声)等音色。
如果您有更多具体需求或问题,欢迎进一步咨询!
ModelScope旨在打造下一代开源的模型即服务共享平台,为泛AI开发者提供灵活、易用、低成本的一站式模型服务产品,让模型应用更简单!欢迎加入技术交流群:微信公众号:魔搭ModelScope社区,钉钉群号:44837352