想训一个自定义唤醒词,想要用样例的数据集一起训练
自行录制音频。您可以使用专业的麦克风和录音软件来录制自己的声音,并创建一个包含多个唤醒词的音频数据集。确保您的录音设备和环境都是稳定的,以获得高质量的音频数据。
下载开放数据集。有些组织和个人会在互联网上共享一些开放的语音数据集,例如 Common Voice 和 VoxCeleb。您可以搜索并下载这些数据集,并从中选择一些与您的应用场景相关的音频数据。
使用语音合成技术生成音频数据。您可以使用 TTS 技术来生成人工合成的唤醒词。例如,您可以使用 Tacotron、WaveNet 或其他开源 TTS 模型来生成语音数据。然后,您可以使用音频编辑软件对生成的音频进行微调和优化。