开发者社区> 问答> 正文

全双工自然对话的技术方案是什么?

全双工自然对话的技术方案是什么?

展开
收起
Gaby_ 2021-12-09 19:29:35 1028 0
1 条回答
写回答
取消 提交回答
  • 设备端:负责听和说。主要解决什么时候听,有没有听到语音,听到的语音有多长;什么时候说,以及说什么。 语音识别:即 ASR,将用户的语音识别成文本,并提取声音的特征。 语义理解:即 NLU,负责理解用户说了什么并转换成机器可读的信息。 语音合成:即 TTS,负责将文本转换成语音。 对话管理:即 DM,根据语义理解的结果和会话的上下文信息调用各种服务完成用户的请求。 人机交互识别:根据 ASR 输出的声学特征判断收到语音是不是用户和音箱说的话。

    image.png

    2021-12-09 20:00:47
    赞同 展开评论 打赏
来源圈子
更多
收录在圈子:
+ 订阅
关于阿里的机器智能创新技术均呈现于此.
问答排行榜
最热
最新

相关电子书

更多
复杂声学环境下的语音交互:技术与实践 立即下载
关于对话交互的在思考、实践和未来展望 立即下载
对话交互:从开端到成长 立即下载