简述智能对话系统-阿里云开发者社区

简述智能对话系统

2022-10-31 1308

版权

本文内容由阿里云实名注册用户自发贡献，版权归原作者所有，阿里云开发者社区不拥有其著作权，亦不承担相应法律责任。具体规则请查看《阿里云开发者社区用户服务协议》和《阿里云开发者社区知识产权保护指引》。如果您发现本社区中有涉嫌抄袭的内容，填写侵权投诉表单进行举报，一经查实，本社区将立刻删除涉嫌侵权内容。

本文涉及的产品

NLP自然语言处理_基础版，每接口每天50万次

NLP自然语言处理_高级版，每接口累计50万次

NLP 自学习平台，3个模型定制额度 1个月

简介： 对话系统（Dialogue System，简称DS），是使人与机器可以通过自然语言进行对话交互的系统。DS除了用准确、简洁的自然语言回答用户用自然语言提出的问题外，更注重与人的交互、对人意图的理解、对对话氛围的感知，以及回答的多样性和个性化。

综述

对话系统（Dialogue System，简称DS），是使人与机器可以通过自然语言进行对话交互的系统。DS除了用准确、简洁的自然语言回答用户用自然语言提出的问题外，更注重与人的交互、对人意图的理解、对对话氛围的感知，以及回答的多样性和个性化。

网络异常，图片无法展示

分类

交互模式

按交互模型划分为文本客服机器人和语音客服机器人。

文本客服机器人

主要包含NLU、DM、NLG等技术

语音客服机器人

除了NLU、DM、NLG等技术之外，还包含ASR、TTS。

场景和功能类型

问答型机器人

问答机器人主要依托于强大的知识库，可对用户提出的问题给出特定回复。对回复内容的准确性要求高，但仅限于一问一答的单轮对话交互，对上下文信息不作处理，目前多用于客服领域。

基于检索匹配的问答技术

基于检索匹配的问答技术通过语义匹配的方式从给定的问答数据集中找出最相似的问题并给出答案。这种方式简单有效，针对问题和答案相对固定的业务场景，通常能够实现较好的对话效果。

网络异常，图片无法展示

基于阅读理解的问答技术

基于阅读理解（Document Understanding，DU）的问答技术旨在围绕给定篇章文档内容完成问答任务。具体而言，该技术面向给定的一篇或若干篇文档，对于用户对话中提出的与文档相关的问题给出正确的回答。该技术主要通过问题理解、段落排序和机器阅读理解等几个主要技术流程实现。

在基于阅读理解的问答技术中，让机器能够阅读自然语言文本，然后回答相关问题的机器阅读理解是核心，也是提升基于阅读理解的对话效果的关键。

网络异常，图片无法展示

任务型机器人

机器人通过多轮对话交互满足用户某一特定任务需求。对任务完成度要求高，其中机器人主要通过对话状态追踪、问槽、澄清等理解用户意图，然后进行回复或调用API等形式完成用户任务需求，如订票、订餐等任务。

实现技术

任务型对话系统目前主要有两种实现技术，一种是基于流水线（pipeline）的实现方式，另一种是基于端到端（end-to-end）的实现方式。

网络异常，图片无法展示

流水线（pipeline）

网络异常，图片无法展示

实现的对话系统的经典结构图，又称规则对话系统。

整个系统有四大核心模块，分别由NLU、DST、DPL和NLG依次串联构成的一条流水线，各模块可独立设计，模块间协作完成任务型对话。

自然语言理解（NLU）：主要对人机交互过程中产生的对话进行语义理解；
对话状态跟踪器（DST）：管理每一轮对话状态，包括历史状态记录及当前状态输出；
对话策略（DPL）：基于当前对话状态执行的下一步系统回应策略；
自然语言生成（NLG）：将对话策略输出的语义转化成自然语言。

端到端（end-to-end）

网络异常，图片无法展示

端到端（end-to-end）的对话系统，主要是结合深度学习技术。采用数据模型驱动，通过海量数据训练，挖掘出从用户自然语言输入到系统自然语言输出的整体映射关系，而忽略中间过程的一种方法。

就目前工业界整体应用而言，虽然端到端（end-to-end）的方法灵活性和可拓展性较高，但其对数据的质量和数量要求也很高，同时还存在不可控性和不可解释性等问题，因此工业界的对话系统目前大多采用的还是基于规则的流水线（pipeline）实现方式。

业务场景

任务式人机对话系统业务场景分为两大类型，即信息检索类和服务满足类。

信息检索类

信息检索类对话系统接收用户以语言形式发出的指令，经过对话理解、对话管理、指令执行和语言生成等环节，查询到用户所需信息并组织语言返回，如智能客服。

服务满足类

服务满足类对话系统的处理流程与信息检索类大致相同。不同之处在于，服务满足类对话系统通常不需要对用户进行自然语言形式的反馈，而是经过对话理解、对话管理和指令执行等环节完成用户发出的指令即可，如天猫精灵。

闲聊型机器人

机器人与用户互动比较开放，用户没有明确目的，机器人回复也没有标准答案。对回复内容的准确度不做要求，主要以趣味性和个性化的回复满足用户情感需求。

闲聊型智能对话的技术框架有两种主流形式，一是基于检索技术的聊天式对话系统，二是基于端到端技术聊天式系统。

基于检索技术的聊天系统

基于检索技术的聊天系统通常由检索模型、匹配模型和排序模型构成。对于给定的用户输入话语，首先由检索模型在对话语料库中查找类似场景并返回多个候选对话问答对，然后由匹配模型判断候选问答对是否可以作为当前用户话语的合理回复，最后由排序模型根据应用场景做一些适配定制后给出最终的回复。该系统由于可以直接使用人类回复，因此在回复的通顺性和风趣性等方面占有优势，但由于缺乏自由度，无法生成从未存在过的新句子，因此被认为不能达到理想状态的对话智能。

基于端到端建模技术的聊天系统

基于端到端建模技术的聊天系统把对话问题当成翻译问题，将对话的上文看做源语言，将对话的下文看成目标语言，使用基于序列到序列的神经网络生成模型直接生成对话回复。对于给定的用户输入话语，端到端建模技术首先使用编码器网络将该输入话语编码为中间语义表示，然后借助解码器网络将该中间语义表示逐步解码为对话回复。端到端模型可以克服检索模型无法生成全新回复的缺陷，能够生成在对话实例库中从未出现过的回复，但由于缺乏对用户话语和回复机制相应的干预，难以保证生成的回复富含信息并和上下文保持连贯性。

网络异常，图片无法展示

智能对话系统的商业和社会价值

行业级（B端）的价值提升

金融业---问题咨询、外呼、工单管理等客服场景中。
零售业---为用户提供个性化产品建议，并主动推送相关产品。
制造业---嵌入智能对话系统，使用户可以控制具有对话式交互功能的电器设备。
政务领域---智能终端可以通过多轮对话快速准确地引导群众定位办事流程，收审所需材料，大幅压缩了等待时间。

消费者（C端）的体验升级

丰富数字生活---购物、烹饪、外卖、出行、家政、游戏、观影、健身等活动都可以借助语音助手等智能对话产品。
助力儿童教育---在早教场景中，伴读机器人引导儿童阅读，在K12教育中，家教机器人能够帮助提升学习效率、丰富学习的趣味性。
改善社会福利---通过智能语音穿戴设备随时监控老年人的身体状态，并接听语音指令下的电话呼叫以提供及时救助。“智能语音护理床”的出现使得患者可通过对话自行控制护理床状态。
服务特殊群体---对于有视觉障碍和语言障碍的特殊群体来说，目前市场中的智能语音客服和语音助理为处理个人事务提供了便利。

简述智能对话系统

综述

分类

交互模式

文本客服机器人

语音客服机器人

场景和功能类型

问答型机器人

基于检索匹配的问答技术

基于阅读理解的问答技术

任务型机器人

实现技术

流水线（pipeline）

端到端（end-to-end）

业务场景

信息检索类

服务满足类

闲聊型机器人

基于检索技术的聊天系统

基于端到端建模技术的聊天系统

智能对话系统的商业和社会价值

行业级（B端）的价值提升

消费者（C端）的体验升级

热门文章

最新文章

相关课程

相关电子书

相关实验场景

热门

活动广场

任务中心

开发者评测

高校计划

乘风者计划

训练营

阿里云MVP

话题

直播

下载

镜像站

技术资料

插件

简述智能对话系统

综述

分类

交互模式

文本客服机器人

语音客服机器人

场景和功能类型

问答型机器人

基于检索匹配的问答技术

基于阅读理解的问答技术

任务型机器人

实现技术

流水线（pipeline）

端到端（end-to-end）

业务场景

信息检索类

服务满足类

闲聊型机器人

基于检索技术的聊天系统

基于端到端建模技术的聊天系统

智能对话系统的商业和社会价值

行业级（B端）的价值提升

消费者（C端）的体验升级

热门文章

最新文章

相关课程

相关电子书

相关实验场景