CB5654语音合成「音色」定制

简介: 本文介绍 CB5654语音合成「音色」定制

语音合成「音色」定制

拿到开发板的小伙伴们应该都会发现,CB5654开发板的原始例程其实存在一个很明显的小bug,就是开机时的那句“正在启动”和之后对话时的语音音色并不统一。”正在启动“听起来严肃又刻板,并且音质失真度很高,和之后对话时的温柔小姐姐根本不是一个音色。

所以本文将会教给大家如何修改内置语音的音色。

语音文件的生成

首先登录阿里云语音引擎控制台的网站

网页右上角注册并登录账号

总体界面是这个样子的

https://nls-portal.console.aliyun.com/overview
image.png

点击创建项目,项目名称可以随意填一填
image.png

把项目的AppKey复制出来 保存一下

回到控制台主界面右上角点击获取AccessToken 复制出来
image.png

主url:nls-gateway.cn-shanghai.aliyuncs.com/stream/v1/tts

后跟post参数

  • appkey = 你的AppKey //
- appkey = 你的AppKey //就填刚刚获取到的参数
- token = 你的Token
- format = mp3        //语音文件格式
- voice = Aixia       //语音AI的名字 艾夏就是CB5654默认的对话时的音色
- speech_rate = 0     //语速调节
- volume = 100         //语音的音量
- text = tts的文字    //就是输入你想要语音合成的文字

最后合成的url格式为:

nls-gateway.cn-shanghai.aliyuncs.com/stream/v1/tts?appkey=LlCqPs5AVPdO7V85&token=b43cad114d4d4e1c8094d0e8e04d7d09&format=mp3&voice=Aixia&speech_rate=0&volume=100&text=我是艾夏

然后就可以自行下载语音文件了

查看所有的可选语音需要再点开项目,点击项目配置,切换到TTS标签,里面支持所有语音的参数调试和试听

image.png

内置语音音色的设置

打开 工程路径appsrcaui_cloudaliyunnlsaui_nlp.c

定位到app_aui_nlp_init函数,文件的218行,将aixia修改对应AI的汉语拼音就可以更换音色啦

贴上几个贼逗的方言AI的名字

台湾腔 青青 东北话 翠姐 广东话 珊珊 四川话 小玥

如果有疑问欢迎在评论区留言。

非常期待别的小伙伴们能够分享一些调试的经验与技巧。

感谢阅读,如果对你的开发有帮助的话请帮忙点下赞哟~

文章来源:芯片开放社区
文章链接:https://occ.t-head.cn/community/post/detail?spm=a2cl5.14300636.0.0.1b87180fqUAdQ2&id=3805265703834628096

相关文章
|
存储 移动开发 算法
语音识别(ASR)--语音转文字
音识别(Automatic Speech Recognition) 是以语音为研究对象,通过语音信号处理和模式识别让机器自动识别和理解人类口述的语。语音识别技术就是让机器通过识别和理解过程把语音信号转变为相应的文本或命令的高技术。语音识别是一门涉及面很广的交叉学科,它与声学、语音学、语言学、信息理论、模式识别理论以及神经生物学等学科都有非常密切的关系。
2037 0
|
2天前
|
API 语音技术
基于Asterisk和TTS/ASR语音识别的配置示例
本文介绍了如何在Asterisk服务器上配置TTS(文本转语音)和ASR(自动语音识别)引擎,包括安装Asterisk、选择并配置TTS和ASR引擎、编辑Asterisk配置文件以实现语音识别和合成的功能,以及测试配置的有效性。具体步骤涉及下载安装包、编辑配置文件、设置API密钥等。
11 1
|
1月前
|
搜索推荐 机器人 数据处理
基于大语言模型的 FireRedTTS 语音合成系统
【10月更文挑战第3天】近年来,随着人工智能技术的发展,基于大语言模型的语音合成系统备受关注。FireRedTTS 系统由郭浩瀚等人提出,旨在满足多样化的语音合成需求。该系统分为数据处理、基础系统和下游应用三部分,通过高质量数据集和语义感知架构生成高保真语音信号。其应用场景包括配音和聊天机器人,能够实现零样本语音克隆和可控类人语音合成,提供自然且个性化的交互体验。然而,系统仍面临计算资源和完全自然语音合成等方面的挑战。[了解更多](https://arxiv.org/abs/2409.03283)
181 3
|
3月前
|
搜索推荐 算法 Linux
这款文本转语音(TTS)
【8月更文挑战第6天】Fish Speech是一款先进的开源文本转语音(TTS)工具,它能迅速将文字转换为流畅自然的语音,尤其适合镜头前感到紧张的人制作视频内容。Fish Speech支持中文、英文及日文等多种语言,可通过简单的原始语音样本快速克隆个性化声音。其架构设计高效,仅需4GB显存即可运行,采用Flash-Attn算法实现高性能语音合成。Fish Speech具备易用性,提供Web界面操作,并可在Linux与Windows系统上部署。用户可通过官网([https://fish.audio/zh-CN/](https://fish.audio/zh-CN/))直接体验其强大功能。
267 0
|
4月前
|
机器学习/深度学习 人工智能 语音技术
语音识别01-----语音合成,分离,变声实战模块介绍
语音识别01-----语音合成,分离,变声实战模块介绍
|
机器学习/深度学习 存储 人工智能
Synthesys:语音合成和视频生成平台
Synthesys:语音合成和视频生成平台
1221 0
Synthesys:语音合成和视频生成平台
|
机器学习/深度学习 自然语言处理 前端开发
Tacotron2、GST、Glow-TTS、Flow-TTS…你都掌握了吗?一文总结语音合成必备经典模型(二)
Tacotron2、GST、Glow-TTS、Flow-TTS…你都掌握了吗?一文总结语音合成必备经典模型
429 1
|
机器学习/深度学习 人工智能 自然语言处理
Tacotron2、GST、Glow-TTS、Flow-TTS…你都掌握了吗?一文总结语音合成必备经典模型(四)
Tacotron2、GST、Glow-TTS、Flow-TTS…你都掌握了吗?一文总结语音合成必备经典模型
1160 0
|
机器学习/深度学习 算法 语音技术
Tacotron2、GST、Glow-TTS、Flow-TTS…你都掌握了吗?一文总结语音合成必备经典模型(三)
Tacotron2、GST、Glow-TTS、Flow-TTS…你都掌握了吗?一文总结语音合成必备经典模型
827 0
|
语音技术
TTS语音播报
TTS语音播报
341 0
TTS语音播报