想问下阿里语音AI中format和save_wav这俩参数是什么意思？

问题一：你好我是android开发，我们集成在nuisdk的时候，对tts参数初始化，
object["format"] = "opus"
object["save_wav"] = "true"，
想问下阿里语音AI中format和save_wav这俩参数是什么意思？
问题二：那android这边format设置成什么比较好，我们AudioTrack播放器设置的是ENCODING_PCM_16BIT

语音合成的话，设置音频格式是用encode_type参数吧，我看默认就是pcm，播放器如果是ENCODING_PCM_16BIT的话用这个值就行吗

展开

收起

乐天香橙派 2023-09-12 12:54:19 283 版权

2 条回答

写回答

取消提交回答

vohelon
问题一：format和save_wav这两个参数是阿里语音AI中的TTS（文本到语音）服务的配置参数。
- format参数指定了生成的语音文件格式。"opus"表示生成的语音文件以Opus格式保存。Opus是一种高效的音频编码格式，能够在较低的比特率下提供较好的音质。您可以根据自己的需求选择合适的音频格式。
- save_wav参数用于控制是否将生成的语音文件保存为WAV格式。如果设置为"true"，则会将生成的语音文件保存为WAV格式；如果设置为"false"，则不保存为WAV格式。WAV是一种无损音频格式，保留了原始音频数据的完整性。
问题二：对于Android端的语音合成，确实可以使用encode_type参数来设置音频格式。默认值为"pcm"，表示生成的音频数据采用PCM格式。如果您的AudioTrack播放器使用的是ENCODING_PCM_16BIT编码格式，那么与"pcm"相对应的就是PCM 16位。

简而言之，如果您的播放器使用的是ENCODING_PCM_16BIT编码格式，且希望与语音合成生成的音频格式保持一致，可以将encode_type参数设置为"pcm"。
2023-09-12 14:03:50

赞同展开评论
一颗橙子11111

针对问题一的回答:format是合成音频的格式，save_wav是是否保存音频
针对问题二的回答：可以的，PCM—此回答来自钉群“阿里语音AI【6群】”

2023-09-12 12:58:27

赞同展开评论

想问下阿里语音AI中format和save_wav这俩参数是什么意思？

相关文章

相关解决方案

探索云世界

热门

云计算

大数据

云原生

人工智能

数据库

开发与运维

活动广场

任务中心

训练营

直播

乘风者计划

下载

镜像站

技术资料

想问下阿里语音AI中format和save_wav这俩参数是什么意思？

相关文章

相关解决方案