ModelScope小助手-渡渡航_个人页

个人头像照片 ModelScope小助手-渡渡航
个人头像照片
0
24
0

个人介绍

暂无个人介绍

擅长的技术

  • Java
获得更多能力
通用技术能力:

暂时未有相关通用技术能力~

云产品技术能力:

阿里云技能认证

详细说明
暂无更多信息

2023年09月

2023年05月

2023年04月

2023年03月

2022年11月

正在加载, 请稍后...
暂无更多信息
  • 回答了问题 2023-09-19

    linux下,ttsfrd和kwsbp包安装失败

    你的python版本是多少?

    踩0 评论0
  • 回答了问题 2023-05-10

    运行语音合成模型的官网代码示例报错

    请更新modelscope版本到最新,并使用https://modelscope.cn/models/damo/speech_sambert-hifigan_tts_zhiyan_emo_zh-cn_16k/summary下最新sample code进行尝试

    踩0 评论0
  • 回答了问题 2023-05-10

    根据文字合成语音,有时候一个句子没录完就突然结束了,这是为什么?

    是指创空间上面么?可能是服务内部问题,请稍后再试

    踩0 评论0
  • 回答了问题 2023-05-10

    模型训练完后,拿到model_id了,后面怎么直接调用这个model_id去合成语音?

    请参考https://modelscope.cn/models/damo/speech_personal_sambert-hifigan_nsf_tts_zh-cn_pretrain_16k/summary中关于“体验模型合成效果”这一节的代码

    踩0 评论0
  • 回答了问题 2023-05-10

    KAN-TTS 在 conda 环境下无法安装 ttsfrd

    请描述下conda环境的python版本?以及贴一下完整的命令及报错信息。

    踩0 评论1
  • 回答了问题 2023-05-10

    在使用text_to_wav.py进行推理时,使用--lang Sichuan 参数出现以下错误:

    kantts相关问题,建议直接在kantts github中提issue给开发者

    踩0 评论0
  • 回答了问题 2023-05-10

    请问该四川方言模型是从头开始训练的吗?能否直接在个性化语音合成模型上进行微调?

    直接基于四川话这个模型finetune即可,不能在个性化语音合成模型上进行微调

    踩0 评论0
  • 回答了问题 2023-05-10

    安装ttsfrd库提示找不到版本

    ttsfrd还在,请检查你的机器是否是x86 linux,以及python为3.7-3.10中的版本

    踩0 评论1
  • 回答了问题 2023-05-10

    可以支持多人的音频同时FineTune训练吗?

    支持,建议钉钉加群:20015016512 询问群主相关方法

    踩0 评论0
  • 回答了问题 2023-05-10

    运行官网示例报错!!

    请pip卸载当前kantts,然后通过下述url下载kantts,modelscope的kantts和github上打包的略有区别。

    https://isv-data.oss-cn-hangzhou.aliyuncs.com/ics/MaaS/TTS/requirements/kantts-0.0.1-py3-none-any.whl

    踩0 评论0
  • 回答了问题 2023-05-10

    PTTS-basemodel微调报错

    ptts finetune依赖gpu,请在gpu环境下使用

    踩0 评论0
  • 回答了问题 2023-05-10

    录音时使用的 20个 句子的选取有什么特殊的地方吗?还是任意选择20个橘子都可以呢?

    任意中文语句长度和展示的那20句差不多即可,现在中英混还有点问题,暂时不支持

    踩0 评论0
  • 回答了问题 2023-04-03

    在NoteBook中训练个性化语音合成模型报错

    PTTS微调训练需要GPU

    踩0 评论1
  • 回答了问题 2023-04-03

    No such file or directory: wav_pre/temp.wav'

    输入音频确认是16k16bit的么?这个看上去是走了resample流程,然后没有装sox导致resample失败了,你可以在ubuntu上apt-get install sox然后再试试看?

    踩0 评论1
  • 回答了问题 2023-04-03

    流程里少了一步,把config.yaml里的speaker_list:后面改成数据集的speaker

    谢谢提醒,我们后续修改下。

    踩0 评论0
  • 回答了问题 2023-04-03

    请问这一块的扩充epoch是在哪部分代码里

    stage0=training_stage voice=test_male_ptts_feats

    cat $stage0/$voice/am_valid.lst >> $stage0/$voice/am_train.lst lines=0 while [ $lines -lt 3200 ] do shuf $stage0/$voice/am_train.lst >> $stage0/$voice/am_train.lst.tmp lines=$(wc -l < "$stage0/$voice/am_train.lst.tmp") done mv $stage0/$voice/am_train.lst.tmp $stage0/$voice/am_train.lst

    踩0 评论0
  • 回答了问题 2023-04-03

    按官网的例子在Notebook上运行的,trainer.train() 报了这个错

    训练需要GPU,看上去是因为torch.cuda.is_available()为false导致

    踩0 评论0
  • 回答了问题 2023-03-15

    Sambert-Hifigan模型 如何使用实时流式合成

    我们提供的python推理代码目前没有支持流式输出,但是开启causal训练的hifigan模型本身是支持流式推理的 在runtime上需要做相应的改动即可支持流式输出

    踩0 评论0
  • 回答了问题 2023-03-15

    pip install ttsfrd 报错

    目前ttsfrd包仅linux x86_64环节下的py36到py310版本,其他平台或python版本暂不支持。

    踩0 评论1
  • 回答了问题 2022-11-28

    GPU相比CPU并没有明显提高uniasr语音识别和语音合成的推理速度

    是的,gpu对训练有较好的提升效果,对目前代码的推理来说加速有限,目前代码的推理纯粹实现在pytorch或tf上,建议使用其他推理框架(比如tensorrt)来针对一些模型进行加速。

    踩0 评论1
正在加载, 请稍后...
滑动查看更多
正在加载, 请稍后...
暂无更多信息