开发者社区> 问答> 正文

在阿里语音AI语音合成中,调用“中文及中英文混合场景”的人物时,如何定义它为英文发音呢?

在阿里语音AI语音合成中,调用“中文及中英文混合场景”的人物时,假设合成英文是“This ruler 100 cm”,调用api后,生成出来的音频中的“100”是中文发音,如何定义它为英文发音呢?

展开
收起
三分钟热度的鱼 2023-05-29 14:31:27 101 0
2 条回答
写回答
取消 提交回答
  • 可以使用SSML标记语言:https://help.aliyun.com/document_detail/101645.html?spm=a2c4g.207373.0.0.73527312virc30 此回答整理自钉群“阿里语音AI【6群】”

    2023-05-29 14:39:47
    赞同 展开评论 打赏
  • 随心分享,欢迎友善交流讨论:)

    在阿里语音AI的语音合成接口中,如果需要合成英文的数字、量词等内容,需要使用对应的英文语音标注方式,以告诉阿里语音AI服务如何正确发音。

    例如,在调用阿里语音AI的语音合成接口时,可以使用 SSML 标记语言对文本内容进行标记和注释,以指定需要发音的语音标注方式。具体步骤如下:

    在需要发音的文本内容中,使用 SSML 语言标记对数字、量词等进行标注,并指定对应的发音方式。例如: 100 cm 这段标记表示将数字“100”标记为基数(cardinal)形式,并按照英文发音方式进行发音。在阿里语音AI服务中,支持多种语音标记方式,可以根据不同的需求进行选择。

    将标记后的文本内容,作为参数传递给阿里语音AI的语音合成接口进行调用,并获取返回的语音数据。

    将返回的语音数据进行解码,并将解码后的数据传递给音频播放组件进行播放。

    需要注意的是,在使用 SSML 标记方式进行发音时,需要确保标记的格式正确,并选择正确的语音标记方式,以保证语音合成的准确性和效果。同时,在播放音频时,需要确保 Unity 中已经配置好相应的音频播放组件和音频文件格式等信息。

    2023-05-29 14:36:01
    赞同 展开评论 打赏
问答排行榜
最热
最新

相关电子书

更多
2023云栖大会:PolarDB for AI 立即下载
2023云栖大会:Lindorm一站式AI数据平台实战 立即下载
释放算力潜能加速应用构建Serverless为AI创新提速 立即下载