问题一:Autolabeling开源项目的主要功能是什么?
Autolabeling开源项目的主要功能是什么?
参考回答:
Autolabeling开源项目是一个音频自动化标注工具,集成了语音降噪(ANS)、语音识别(ASR)、语音端点检测(VAD)等多种原子能力,使用户可以直接通过Autolabel工具获取音频所对应的文本、音素、音素时间戳、韵律标注等多种标注信息。
关于本问题的更多问答可点击原文查看:
https://developer.aliyun.com/ask/656861
问题二:Autolabeling开源项目支持哪些采样率的音频输入?
Autolabeling开源项目支持哪些采样率的音频输入?
参考回答:
Autolabeling开源项目支持三种采样率(16k 24k 48k)音频的输入。
关于本问题的更多问答可点击原文查看:
https://developer.aliyun.com/ask/656862
问题三:KAN-TTS开源项目包含哪些模型的训练与推理脚本?
KAN-TTS开源项目包含哪些模型的训练与推理脚本?
参考回答:
KAN-TTS开源项目包含Sambert、nsf-hifigan等模型的训练、推理脚本,能够训练出具有高自然度和韵律丰富度的语音合成模型。
关于本问题的更多问答可点击原文查看:
https://developer.aliyun.com/ask/656863
问题四:KAN-TTS开源项目支持哪些语言和方言的数据处理?
KAN-TTS开源项目支持哪些语言和方言的数据处理?
参考回答:
KAN-TTS开源项目支持中、英、日、德、韩等十一种外语和上海话、四川话、粤语等多地方言的数据处理。
关于本问题的更多问答可点击原文查看:
https://developer.aliyun.com/ask/656864
问题五:如何查看KAN-TTS在ModelScope上的模型列表?
如何查看KAN-TTS在ModelScope上的模型列表?
参考回答:
可以通过访问ModelScope的模型列表页面https://www.modelscope.cn/models?page=1&tasks=text-to-speech&type=audio
,选择"text-to-speech"任务和"audio"类型来查看KAN-TTS的模型列表。
关于本问题的更多问答可点击原文查看: