CB5654语音合成「音色」定制

简介: 本文介绍 CB5654语音合成「音色」定制

语音合成「音色」定制

拿到开发板的小伙伴们应该都会发现,CB5654开发板的原始例程其实存在一个很明显的小bug,就是开机时的那句“正在启动”和之后对话时的语音音色并不统一。”正在启动“听起来严肃又刻板,并且音质失真度很高,和之后对话时的温柔小姐姐根本不是一个音色。

所以本文将会教给大家如何修改内置语音的音色。

语音文件的生成

首先登录阿里云语音引擎控制台的网站

网页右上角注册并登录账号

总体界面是这个样子的

https://nls-portal.console.aliyun.com/overview
image.png

点击创建项目,项目名称可以随意填一填
image.png

把项目的AppKey复制出来 保存一下

回到控制台主界面右上角点击获取AccessToken 复制出来
image.png

主url:nls-gateway.cn-shanghai.aliyuncs.com/stream/v1/tts

后跟post参数

  • appkey = 你的AppKey //
- appkey = 你的AppKey //就填刚刚获取到的参数
- token = 你的Token
- format = mp3        //语音文件格式
- voice = Aixia       //语音AI的名字 艾夏就是CB5654默认的对话时的音色
- speech_rate = 0     //语速调节
- volume = 100         //语音的音量
- text = tts的文字    //就是输入你想要语音合成的文字

最后合成的url格式为:

nls-gateway.cn-shanghai.aliyuncs.com/stream/v1/tts?appkey=LlCqPs5AVPdO7V85&token=b43cad114d4d4e1c8094d0e8e04d7d09&format=mp3&voice=Aixia&speech_rate=0&volume=100&text=我是艾夏

然后就可以自行下载语音文件了

查看所有的可选语音需要再点开项目,点击项目配置,切换到TTS标签,里面支持所有语音的参数调试和试听

image.png

内置语音音色的设置

打开 工程路径appsrcaui_cloudaliyunnlsaui_nlp.c

定位到app_aui_nlp_init函数,文件的218行,将aixia修改对应AI的汉语拼音就可以更换音色啦

贴上几个贼逗的方言AI的名字

台湾腔 青青 东北话 翠姐 广东话 珊珊 四川话 小玥

如果有疑问欢迎在评论区留言。

非常期待别的小伙伴们能够分享一些调试的经验与技巧。

感谢阅读,如果对你的开发有帮助的话请帮忙点下赞哟~

文章来源:芯片开放社区
文章链接:https://occ.t-head.cn/community/post/detail?spm=a2cl5.14300636.0.0.1b87180fqUAdQ2&id=3805265703834628096

相关文章
|
存储 移动开发 算法
语音识别(ASR)--语音转文字
音识别(Automatic Speech Recognition) 是以语音为研究对象,通过语音信号处理和模式识别让机器自动识别和理解人类口述的语。语音识别技术就是让机器通过识别和理解过程把语音信号转变为相应的文本或命令的高技术。语音识别是一门涉及面很广的交叉学科,它与声学、语音学、语言学、信息理论、模式识别理论以及神经生物学等学科都有非常密切的关系。
1657 0
|
4月前
|
人工智能 编解码 自然语言处理
离线生成双语字幕,一键生成中英双语字幕,基于AI大模型,ModelScope
制作双语字幕的方案网上有很多,林林总总,不一而足。制作双语字幕的原理也极其简单,无非就是人声背景音分离、语音转文字、文字翻译,最后就是字幕文件的合并,但美中不足之处这些环节中需要接口api的参与,比如翻译字幕,那么有没有一种彻底离线的解决方案?让普通人也能一键制作双语字幕,成就一个人的字幕组?
离线生成双语字幕,一键生成中英双语字幕,基于AI大模型,ModelScope
|
11月前
|
机器学习/深度学习 存储 人工智能
Synthesys:语音合成和视频生成平台
Synthesys:语音合成和视频生成平台
674 0
Synthesys:语音合成和视频生成平台
|
机器学习/深度学习 人工智能 达摩院
如何打造真人化高表现力的语音合成系统
语音合成技术作为人机交互的重要环节,终极目标即达到媲美真人的合成效果。高表现力语音合成逐渐成为未来的趋势。高表现力语音有三个显著的特点:韵律自然、情感风格丰富和音质清澈。 需要认识到的是当下的技术水平在韵律自然表示、情感风格丰富度上和真人之间还存在着较大的、人耳容易分辨的差距。 因此,我们针对这三个特点,进行算法上的探索,形成达摩院第五代语音合成技术——基于韵律建模的 SAM-BERT、情感语音合成 Emotion TTS 和高清语音合成 HiFi-TTS 的 Expressive-TTS。
266 0
|
12月前
|
机器学习/深度学习 算法 语音技术
Tacotron2、GST、Glow-TTS、Flow-TTS…你都掌握了吗?一文总结语音合成必备经典模型(三)
Tacotron2、GST、Glow-TTS、Flow-TTS…你都掌握了吗?一文总结语音合成必备经典模型
651 0
|
12月前
|
机器学习/深度学习 人工智能 自然语言处理
Tacotron2、GST、Glow-TTS、Flow-TTS…你都掌握了吗?一文总结语音合成必备经典模型(四)
Tacotron2、GST、Glow-TTS、Flow-TTS…你都掌握了吗?一文总结语音合成必备经典模型
864 0
|
12月前
|
机器学习/深度学习 自然语言处理 前端开发
Tacotron2、GST、Glow-TTS、Flow-TTS…你都掌握了吗?一文总结语音合成必备经典模型(二)
Tacotron2、GST、Glow-TTS、Flow-TTS…你都掌握了吗?一文总结语音合成必备经典模型
259 1
|
Linux 语音技术 开发工具
巧用讯飞TTS进行文本合成语音(LINUX操作系统)
如果执行demo程序tts_offline_sample失败,那么请看下是否将libmsc.so有没有加载到ldconfig中。如果没有,则将libmsc.so放到/usr/lib64下,然后用root
巧用讯飞TTS进行文本合成语音(LINUX操作系统)
|
机器学习/深度学习 自然语言处理 达摩院
语音合成技术|学习笔记
快速学习语音合成技术
394 0
语音合成技术|学习笔记
|
语音技术
TTS语音播报
TTS语音播报
240 0
TTS语音播报