开发者社区 > ModelScope模型即服务 > 语音 > 正文

可以提供微调阶段的训练集吗?

想训一个自定义唤醒词,想要用样例的数据集一起训练

展开
收起
Chin2018 2023-06-12 11:18:10 144 0
1 条回答
写回答
取消 提交回答
  • 北京阿里云ACE会长

    自行录制音频。您可以使用专业的麦克风和录音软件来录制自己的声音,并创建一个包含多个唤醒词的音频数据集。确保您的录音设备和环境都是稳定的,以获得高质量的音频数据。

    下载开放数据集。有些组织和个人会在互联网上共享一些开放的语音数据集,例如 Common Voice 和 VoxCeleb。您可以搜索并下载这些数据集,并从中选择一些与您的应用场景相关的音频数据。

    使用语音合成技术生成音频数据。您可以使用 TTS 技术来生成人工合成的唤醒词。例如,您可以使用 Tacotron、WaveNet 或其他开源 TTS 模型来生成语音数据。然后,您可以使用音频编辑软件对生成的音频进行微调和优化。

    2023-07-10 08:51:32
    赞同 展开评论 打赏

包括语音识别、语音合成、语音唤醒、声学设计及信号处理、声纹识别、音频事件检测等多个领域

相关电子书

更多
低代码开发师(初级)实战教程 立即下载
冬季实战营第三期:MySQL数据库进阶实战 立即下载
阿里巴巴DevOps 最佳实践手册 立即下载