问题一: 在阿里语音AI我们目前线上有的用户手机,播放的时候断断续续的,是因为采样率过低,导致缓冲区过小吗?
问题二: 现在采样率设置的16000,最小缓存区设置的系统建议缓存区大小的4倍,用户不是中断,就是卡麦的那种感觉,卡一下继续读然后又卡一下这样
语音识别的时候,有个参数是service_type,我看他的值是0-5
4的话是实时语音识别,那0,1,2,3是什么意思呀
针对问题一的回答:现在播放这块是怎么设置的,可以等已经有一个缓存在等着了再播放当前的缓存,确保播放不会中断
针对问题二的回答: 如果是4倍,容易出现一两三个字的语音合成由于合成的音频太短,无法触发底层音频数据播放的阈值,导致没有播放。你说的播放卡顿的情况大多数是因为播放的手机性能不足导致底层软中断响应不够及时导致。如果业务上没有合成一两三个字的情况,这个buffer当然越大越好。
0是一句话识别和唤醒识别,4是实时识别,其他的内部项目用,保留不使用。
—此回答来自钉群“阿里语音AI【6群】”
版权声明:本文内容由阿里云实名注册用户自发贡献,版权归原作者所有,阿里云开发者社区不拥有其著作权,亦不承担相应法律责任。具体规则请查看《阿里云开发者社区用户服务协议》和《阿里云开发者社区知识产权保护指引》。如果您发现本社区中有涉嫌抄袭的内容,填写侵权投诉表单进行举报,一经查实,本社区将立刻删除涉嫌侵权内容。