开发者社区> 问答> 正文

在阿里语音AI我们目前线上有的用户手机,播放的时候断断续续的,是因为采样率过低,导致缓冲区过小吗?

问题一: 在阿里语音AI我们目前线上有的用户手机,播放的时候断断续续的,是因为采样率过低,导致缓冲区过小吗?
问题二: 现在采样率设置的16000,最小缓存区设置的系统建议缓存区大小的4倍,用户不是中断,就是卡麦的那种感觉,卡一下继续读然后又卡一下这样
871b7f2130ec53785c625060ed770ec0.png
语音识别的时候,有个参数是service_type,我看他的值是0-5
292a0d568abe2c9d8fbf2397006a1d75.png
4f20e0721526db271ffdec90c17b2f78.png
4的话是实时语音识别,那0,1,2,3是什么意思呀

展开
收起
乐天香橙派 2023-09-12 12:54:20 90 0
1 条回答
写回答
取消 提交回答
  • 针对问题一的回答:现在播放这块是怎么设置的,可以等已经有一个缓存在等着了再播放当前的缓存,确保播放不会中断
    针对问题二的回答: 如果是4倍,容易出现一两三个字的语音合成由于合成的音频太短,无法触发底层音频数据播放的阈值,导致没有播放。你说的播放卡顿的情况大多数是因为播放的手机性能不足导致底层软中断响应不够及时导致。如果业务上没有合成一两三个字的情况,这个buffer当然越大越好。
    0是一句话识别和唤醒识别,4是实时识别,其他的内部项目用,保留不使用。
    —此回答来自钉群“阿里语音AI【6群】”

    2023-09-12 12:58:26
    赞同 展开评论 打赏
问答排行榜
最热
最新

相关电子书

更多
Lindorm AI 能力介绍 立即下载
2023云栖大会:PolarDB for AI 立即下载
2023云栖大会:Lindorm一站式AI数据平台实战 立即下载