开发者社区> 问答> 正文

阿里语音AI的语音实时识别安卓sdk 有可以暂停识别和恢复识别的api吗?

问题一:阿里语音AI的语音实时识别安卓sdk 有可以暂停识别和恢复识别的api吗?其实我是想解决一下tts后被反复识别的问问题
问题二:我接入了语音识别的SDK,然后接入了语音合成的SDK,都是基于安卓平台的。接入后发现一个问题,当我说句话,识别正常,通过扬声器语音合成出来,又回被进入下次识别。我是希望只有人说话被识别,手机扬声器合生的声音不被识别,请问大佬有什么办法吗?

展开
收起
乐天香橙派 2023-08-01 16:49:05 121 0
3 条回答
写回答
取消 提交回答
  • 北京阿里云ACE会长

    问题一:阿里云语音实时识别SDK提供了pause()和resume()方法来暂停和恢复语音识别。您可以在需要暂停识别的时候调用pause()方法,然后在需要恢复识别的时候调用resume()方法。如果您想要避免TTS被反复识别的问题,可以在TTS播放时暂停语音识别,等TTS播放完毕后再恢复语音识别。

    问题二:为了避免扬声器合成的声音被识别,您可以在语音识别的时候,将声音来源设置为麦克风,而不是扬声器。这样可以避免识别到扬声器合成的声音。具体来说,您可以在调用语音识别SDK的时候,传入一个参数指定声音来源为麦克风。另外,您还可以设置语音识别的灵敏度,以避免一些不必要的识别。

    2023-08-01 22:09:26
    赞同 展开评论 打赏
  • 面对过去,不要迷离;面对未来,不必彷徨;活在今天,你只要把自己完全展示给别人看。

    是的,阿里语音AI的语音实时识别安卓SDK提供了可以暂停和恢复识别的API。

    在安卓SDK中,你可以使用pause()方法来暂停语音识别过程,以停止接收新的语音输入并暂时停止识别。而后,你可以使用resume()方法来恢复语音识别,继续接收语音输入并进行识别。

    具体的API调用方式可能会根据使用的SDK版本而略有不同,请参考阿里云官方提供的安卓SDK文档或示例代码,了解具体的API名称、参数和使用方法。

    通过使用这些API,你可以在需要的情况下灵活地控制语音识别的进行,暂停和恢复识别过程,以满足你的应用需求。

    2023-08-01 19:07:08
    赞同 展开评论 打赏
  • 针对问题一的回答:暂停是停止识别吧?恢复没有?
    针对问题二的回答:麦克风只有一个 会被收音就会被识别的
    MediaRecorder.AudioSource.DEFAULT 缓存 MediaRecorder.AudioSource.VOICE_COMMUNICATION。切换android的VOIP模式,一定程度可以改善这个问题—此回答来自钉群“阿里语音AI【6群】”

    2023-08-01 17:48:26
    赞同 展开评论 打赏
问答排行榜
最热
最新

相关电子书

更多
从 SDK 到编解码:视频直播架构解析 立即下载
跨平台的云服务SDK需要什么 立即下载
一个跨平台的云服务SDK需要什么 立即下载