开发者学堂课程【阿里巴巴智能语音交互技术与应用:通过 SDK 使用语音合成功能】学习笔记,与课程紧密联系,让用户快速学习知识。
课程地址:https://developer.aliyun.com/learning/course/376/detail/4714
通过 SDK 使用语音合成功能
内容介绍:
一、语音合成代码的参数
二、 合成语音文件
一、语音合成代码的参数
(1)设置要传入的合成文本
这里设置的是一首李清照的诗。
(2)输出的语音格式(pcm 或者是 wav)以及音量和语速的设置。
(3)发音的语调(peechrate)
阈值是-500~500,数值从低到高表现为由低沉到高抗。
(4)设置背景音乐
主要提供了几个设定好的背景音乐,目前不支持用户自定义音乐,这个场景主要是应用于电话客服那种发音,设置背景音乐后用户听起来会比较舒服。
(5)Nus
Nus 的参数有两个,一个是临危参数,1为拼接,意思是指合成的语音是通过完全由算法的参数合成,还是用原始录音拼接生成一个语音。另一个 reference,意思是是有一些发音,如果合成和的预期是不符合的,可以做一定的修改。比如说中国的拼音 zhongguo,可以在后面添上1234,1234是声调,
(6)发音人的选择
目前支持的发音人有 xiaoyu 和 xiaogang,xiaoyu 是女声,xiaogang 是男声。
二、 合成语音文件
传入 Acess 的信息。运行这个代码,就可以合成出这个语音文件。