开发者社区 问答 正文

我这边定制的个性化人声,能不能直接在阿里云语音AI的页面上用文案生成音频呢?我没有找到入口

我这边定制的个性化人声,能不能直接在阿里云语音AI的页面上用文案生成音频呢?我没有找到入口

展开
收起
我是三好学生 2024-01-25 20:02:46 61 发布于辽宁 分享
分享
版权
举报
阿里云 AI 助理回答

在阿里云语音AI的页面上,您可以通过以下方式使用定制的个性化人声生成音频。以下是具体的操作步骤和相关信息:


1. 确认个性化人声定制状态

在使用定制的个性化人声之前,请确保您的声音模型已经训练成功,并且可以在控制台中试听效果。
- 操作路径:登录阿里云智能语音交互控制台 > 进入“个性化人声定制”页面 > 查看声音模型的状态。 - 重要提示:如果声音模型未训练完成或未绑定到项目,将无法正常使用。


2. 使用控制台界面生成音频

如果您希望通过阿里云语音AI的控制台页面直接生成音频,可以按照以下步骤操作:

步骤 1:选择项目并绑定声音模型

  • 在控制台中,选择一个项目(AppKey),因为个性化人声模型会与项目绑定。
  • 警告:删除项目会导致对应的个性化声音模型无法调用,请谨慎操作。

步骤 2:进入语音合成页面

  • 导航至“服务管理与开通” > “语音合成”,确保语音合成服务已开通(试用版或商用版)。
  • 如果是新开通服务的用户,前3个月可免费试用;超过试用期后需升级为商用版(付费)。

步骤 3:填写文案并选择音色

  • 在语音合成页面,输入需要转换为音频的文案内容。
  • 在“音色”选项中,填入您定制的个性化人声的模型调用ID(VoiceId)。
    • 获取模型调用ID:在控制台的“个性化人声定制”页面,单击“音色试听”,进入详情页即可查看。
  • 示例代码:
    synthesizer.setVoice("${模型调用ID}");
    

步骤 4:生成音频

  • 单击“生成”按钮,系统会根据您输入的文案和选择的音色生成音频文件。
  • 限制:控制台界面仅支持单次合成内容小于等于300字。如果文案超过300字,请使用长文本语音合成接口。

3. 使用API或SDK生成音频

如果您无法在控制台找到入口,或者需要批量生成音频,可以通过API或SDK调用个性化人声。以下是相关说明:

API调用方式

  • 调用语音合成接口时,将CustomizedVoice参数设置为您定制的模型调用ID
  • 示例代码:
    synthesizer.setVoice("${模型调用ID}");
    
  • 适用场景:适合集成到应用程序中,支持批量生成音频。

SDK调用方式

  • 下载并集成阿里云提供的SDK(支持Java、Python、Go、PHP和Node.js等多种语言)。
  • 使用方法与API调用类似,具体文档请参考官方接口说明。

4. 注意事项

  • 区域限制:目前个性化人声功能仅支持北京、上海、杭州区域可用。
  • 计费规则
    • 新开通服务的用户在3个月内免费试用。
    • 超过试用期后,控制台界面使用费用为3.5元/千次,API&SDK接口使用费用为3元/万字。
  • 音频格式:默认生成MP3格式,支持PCM/WAV/MP3格式。

总结

您可以通过阿里云语音AI的控制台页面直接使用文案生成音频,但需要确保个性化人声模型已训练成功并绑定到项目。如果控制台入口不可见,建议通过API或SDK调用生成音频。如有进一步问题,请参考官方文档或联系技术支持。

有帮助
无帮助
AI 助理回答生成答案可能存在不准确,仅供参考
0 条回答
写回答
取消 提交回答