开发者社区 问答 正文

全双工自然对话的技术方案是什么?

全双工自然对话的技术方案是什么?

展开
收起
Gaby_ 2021-12-09 19:29:35 1052 分享
分享
版权
来自: 阿里机器智能 举报
1 条回答
写回答
取消 提交回答
  • 设备端:负责听和说。主要解决什么时候听,有没有听到语音,听到的语音有多长;什么时候说,以及说什么。 语音识别:即 ASR,将用户的语音识别成文本,并提取声音的特征。 语义理解:即 NLU,负责理解用户说了什么并转换成机器可读的信息。 语音合成:即 TTS,负责将文本转换成语音。 对话管理:即 DM,根据语义理解的结果和会话的上下文信息调用各种服务完成用户的请求。 人机交互识别:根据 ASR 输出的声学特征判断收到语音是不是用户和音箱说的话。

    image.png

    2021-12-09 20:00:47 举报
    赞同 评论

    评论

    全部评论 (0)

    登录后可评论
AI助理

你好,我是AI助理

可以解答问题、推荐解决方案等