开发者社区 > ModelScope模型即服务 > 语音 > 正文

求:个人声音定制功能 --本地私有化部署说明

这个声音定制功能可以在本地私有化部署吗?
如果我想本地化使用这个个人声音定制功能(用我自己的电脑,自己录音20句或者1000句,训练定制声音模型,然后使用该模型进行推理),需要怎么做?有没有使用说明。
感谢!

----当前在https://modelscope.cn/studios/damo/personal_tts/summary页面录制了20句语音,然后点击按钮进行训练,等训练完成后选中自己的声音模型,并输入文本合成声音。

但是这个训练过程似乎比10分钟要长不少,而且推理速度好像比较慢,我能把这个技术转为本地使用吗?

----另外,如果我只提供20句语音的音频,是否可以得到快速的调用?现在的定制模型的合成速度比较慢。

展开
收起
游客mrzds54w2vgyw 2023-08-14 15:19:46 545 0
2 条回答
写回答
取消 提交回答
  • 这个看来不是开源得,只是作为演示,吸引付费。。。

    2023-08-24 08:20:04
    赞同 展开评论 打赏
  • 北京阿里云ACE会长

    https://help.aliyun.com/document_detail/2399822.html?spm=a2c4g.198786.0.i8

    image.png

    image.png

    数据采集:使用你自己的设备(如麦克风)录制足够数量的语音样本。通常建议采集20句或更多的样本,以获得更准确的声纹模型。

    创建声纹模型:在阿里云控制台上,选择声纹识别服务,创建一个声纹模型。将录制的语音样本上传到阿里云,让系统学习和建模你的声纹特征。

    训练模型:阿里云声纹识别服务会根据上传的语音样本自动进行训练。在训练过程中,系统将学习你的声音特征,并生成对应的声纹模型。

    验证和调优:完成模型训练后,你可以使用其他语音样本对模型进行验证,以评估模型的准确性和性能。如果需要,你可以根据验证结果进行模型调优。

    使用定制模型:一旦声纹模型训练完成,你可以将其应用于声纹识别场景。例如,在需要验证个人身份的场景中,可以使用你的声纹模型进行识别和验证。

    2023-08-16 07:17:04
    赞同 展开评论 打赏

包括语音识别、语音合成、语音唤醒、声学设计及信号处理、声纹识别、音频事件检测等多个领域

相关电子书

更多
低代码开发师(初级)实战教程 立即下载
冬季实战营第三期:MySQL数据库进阶实战 立即下载
阿里巴巴DevOps 最佳实践手册 立即下载