暂无个人介绍
暂时未有相关通用技术能力~
阿里云技能认证
详细说明2023年09月
2023年05月
2023年04月
2023年03月
2022年11月
你的python版本是多少?
请更新modelscope版本到最新,并使用https://modelscope.cn/models/damo/speech_sambert-hifigan_tts_zhiyan_emo_zh-cn_16k/summary下最新sample code进行尝试
是指创空间上面么?可能是服务内部问题,请稍后再试
请参考https://modelscope.cn/models/damo/speech_personal_sambert-hifigan_nsf_tts_zh-cn_pretrain_16k/summary中关于“体验模型合成效果”这一节的代码
请描述下conda环境的python版本?以及贴一下完整的命令及报错信息。
kantts相关问题,建议直接在kantts github中提issue给开发者
直接基于四川话这个模型finetune即可,不能在个性化语音合成模型上进行微调
ttsfrd还在,请检查你的机器是否是x86 linux,以及python为3.7-3.10中的版本
支持,建议钉钉加群:20015016512 询问群主相关方法
请pip卸载当前kantts,然后通过下述url下载kantts,modelscope的kantts和github上打包的略有区别。
https://isv-data.oss-cn-hangzhou.aliyuncs.com/ics/MaaS/TTS/requirements/kantts-0.0.1-py3-none-any.whl
ptts finetune依赖gpu,请在gpu环境下使用
任意中文语句长度和展示的那20句差不多即可,现在中英混还有点问题,暂时不支持
PTTS微调训练需要GPU
输入音频确认是16k16bit的么?这个看上去是走了resample流程,然后没有装sox导致resample失败了,你可以在ubuntu上apt-get install sox然后再试试看?
谢谢提醒,我们后续修改下。
stage0=training_stage voice=test_male_ptts_feats
cat $stage0/$voice/am_valid.lst >> $stage0/$voice/am_train.lst lines=0 while [ $lines -lt 3200 ] do shuf $stage0/$voice/am_train.lst >> $stage0/$voice/am_train.lst.tmp lines=$(wc -l < "$stage0/$voice/am_train.lst.tmp") done mv $stage0/$voice/am_train.lst.tmp $stage0/$voice/am_train.lst
训练需要GPU,看上去是因为torch.cuda.is_available()为false导致
我们提供的python推理代码目前没有支持流式输出,但是开启causal训练的hifigan模型本身是支持流式推理的 在runtime上需要做相应的改动即可支持流式输出
目前ttsfrd包仅linux x86_64环节下的py36到py310版本,其他平台或python版本暂不支持。
是的,gpu对训练有较好的提升效果,对目前代码的推理来说加速有限,目前代码的推理纯粹实现在pytorch或tf上,建议使用其他推理框架(比如tensorrt)来针对一些模型进行加速。