问题一:阿里语音AI的语音实时识别安卓sdk 有可以暂停识别和恢复识别的api吗?其实我是想解决一下tts后被反复识别的问问题
问题二:我接入了语音识别的SDK,然后接入了语音合成的SDK,都是基于安卓平台的。接入后发现一个问题,当我说句话,识别正常,通过扬声器语音合成出来,又回被进入下次识别。我是希望只有人说话被识别,手机扬声器合生的声音不被识别,请问大佬有什么办法吗?
问题一:阿里云语音实时识别SDK提供了pause()和resume()方法来暂停和恢复语音识别。您可以在需要暂停识别的时候调用pause()方法,然后在需要恢复识别的时候调用resume()方法。如果您想要避免TTS被反复识别的问题,可以在TTS播放时暂停语音识别,等TTS播放完毕后再恢复语音识别。
问题二:为了避免扬声器合成的声音被识别,您可以在语音识别的时候,将声音来源设置为麦克风,而不是扬声器。这样可以避免识别到扬声器合成的声音。具体来说,您可以在调用语音识别SDK的时候,传入一个参数指定声音来源为麦克风。另外,您还可以设置语音识别的灵敏度,以避免一些不必要的识别。
是的,阿里语音AI的语音实时识别安卓SDK提供了可以暂停和恢复识别的API。
在安卓SDK中,你可以使用pause()
方法来暂停语音识别过程,以停止接收新的语音输入并暂时停止识别。而后,你可以使用resume()
方法来恢复语音识别,继续接收语音输入并进行识别。
具体的API调用方式可能会根据使用的SDK版本而略有不同,请参考阿里云官方提供的安卓SDK文档或示例代码,了解具体的API名称、参数和使用方法。
通过使用这些API,你可以在需要的情况下灵活地控制语音识别的进行,暂停和恢复识别过程,以满足你的应用需求。
针对问题一的回答:暂停是停止识别吧?恢复没有?
针对问题二的回答:麦克风只有一个 会被收音就会被识别的
MediaRecorder.AudioSource.DEFAULT 缓存 MediaRecorder.AudioSource.VOICE_COMMUNICATION。切换android的VOIP模式,一定程度可以改善这个问题—此回答来自钉群“阿里语音AI【6群】”
版权声明:本文内容由阿里云实名注册用户自发贡献,版权归原作者所有,阿里云开发者社区不拥有其著作权,亦不承担相应法律责任。具体规则请查看《阿里云开发者社区用户服务协议》和《阿里云开发者社区知识产权保护指引》。如果您发现本社区中有涉嫌抄袭的内容,填写侵权投诉表单进行举报,一经查实,本社区将立刻删除涉嫌侵权内容。