开发者社区> 问答> 正文

阿里语音AI正常的采样率和码率是多少?

问题1: sampleRate:44100, encodeBitRate:1411200, format: 'wav', 阿里语音AI正常的采样率和码率是多少?接口地址:https://nls-gateway-cn-shanghai.aliyuncs.com/stream/v1/asr 问题2:这是我前端录音代码,image.png设的这是这个。 {"task_id":"a332bcc5df9e47a8b4d604418ba31cb4","result":"","status":20000000,"message":"SUCCESS"} $ curl -X POST -H "X-NLS-Token:0044c7c218084a47b887a96b67d0687f" https://nls-gateway-cn-shanghai.aliyuncs.com/stream/v1/asr?appkey=aNAx6wBvFXVGtLe2 --data-binary @./1684725023716.wav % Total % Received % Xferd Average Speed Time Time Time Current Dload Upload Total Spent Left Speed 100 4358 100 96 100 4262 235 10446 --:--:-- --:--:-- --:--:-- 10760{"task_id":"a332bcc5df9e47a8b4d604418ba31cb4","result":"","status":20000000,"message":"SUCCESS"}

展开
收起
三分钟热度的鱼 2023-05-29 11:45:23 144 0
2 条回答
写回答
取消 提交回答
  • 针对问题1的回答:我们只支持8k 和16k。针对问题2的回答:看了下 应该是你这个音频格式不符:单声道、16bit、mono格式的。这是正确格式:image.png此回答整理自钉群“阿里语音AI【6群】”

    2023-05-29 12:51:04
    赞同 展开评论 打赏
  • 随心分享,欢迎友善交流讨论:)

    阿里语音AI的正常采样率和码率取决于您使用的语音识别接口和语音文件的格式。一般来说,阿里语音AI支持多种语音格式,包括PCM、WAV、MP3等,不同格式的语音文件所需要的采样率和码率也不同。在使用语音识别接口时,您可以通过接口文档了解所支持的语音格式和参数要求,并根据实际情况进行设置。

    您提供的前端录音代码比较简短,无法准确判断录音参数设置是否正确。一般来说,录音参数应该与您使用的语音识别接口要求的参数相匹配,包括采样率、码率、音频格式等。同时,也需要注意录音的声音质量和噪声情况,以提高语音识别的准确率。如果您需要更具体的建议,建议您提供更详细的代码和使用的语音识别接口信息,我们可以帮助您进行排查和调试。

    2023-05-29 11:54:45
    赞同 展开评论 打赏
问答排行榜
最热
最新

相关电子书

更多
智算时代,基于 Kubernetes 落地云原生 AI 立即下载
AI让数据库的路走的“更快更远” 立即下载
Data+AI时代大数据平台应该如何建设 立即下载