开发者社区> 问答> 正文

阿里语音AI用户反馈,他在说"是的"的时候,sdk识别成了"嗯“请问这是什么问题呢?

我们工程使用了com.okinc.business:nuisdk-release:2.5.14-01B-20230331 sdk版本,但是目前有个用户反馈,他在说"是的"的时候,sdk识别成了"嗯",我们看了用户录制的视频,从他的口型上能看出来他说的确实是"是的",请问这是什么问题呢?

展开
收起
乐天香橙派 2023-10-29 15:23:59 73 0
1 条回答
写回答
取消 提交回答
  • 问题一:根据您提供的信息,用户在使用com.okinc.business:nuisdk-release:2.5.14-01B-20230331 SDK版本时,当他说"是的"时,SDK识别成了"嗯"。从用户录制的视频中可以看出,他的口型确实是在说"是的"。这个问题可能是由于SDK的语音识别算法或模型存在误判导致的。

    问题二:如果用户手机录制的视频中没有听见声音,并且SDK返回的json里result确实也是"嗯",那么很可能是SDK在处理音频数据时出现了问题。建议您检查SDK的配置和使用方式是否正确,并确保音频数据的质量和格式符合SDK的要求。另外,您还可以尝试使用其他设备和环境来测试SDK的表现,以确定问题是否与特定设备或环境有关。

    问题三:根据您的描述,这个语音转文字的任务没有taskId参数。通常情况下,语音转文字任务会分配一个唯一的taskId用于标识和跟踪任务的状态和结果。如果您确认没有提供taskId参数,那么可能是SDK在处理任务时出现了问题。

    问题四:根据您提供的JSON数据,任务的状态码为20000000,状态文本为"Gateway:SUCCESS:Success.",表示任务成功完成。然而,结果字段中的值为"嗯",与用户的口型不符。这可能是由于SDK在处理音频数据时出现了误判或错误。

    问题五:根据您提供的信息,目前只有一个用户反馈了这个问题,并且用户设备是OPPOreno4 5 G,表示是普通话,环境也很安静。在这种情况下,您可以先尝试通过与用户交流来了解更多细节和背景信息。然后,您可以根据taskId分析任务的处理过程和结果,以确定是否存在异常或错误。

    2023-10-30 15:44:32
    赞同 展开评论 打赏
问答排行榜
最热
最新

相关电子书

更多
从 SDK 到编解码:视频直播架构解析 立即下载
跨平台的云服务SDK需要什么 立即下载
一个跨平台的云服务SDK需要什么 立即下载