简述智能对话系统

本文涉及的产品
NLP 自学习平台,3个模型定制额度 1个月
NLP自然语言处理_高级版,每接口累计50万次
NLP自然语言处理_基础版,每接口每天50万次
简介: 对话系统(Dialogue System,简称DS),是使人与机器可以通过自然语言进行对话交互的系统。DS除了用准确、简洁的自然语言回答用户用自然语言提出的问题外,更注重与人的交互、对人意图的理解、对对话氛围的感知,以及回答的多样性和个性化。

综述


对话系统(Dialogue System,简称DS),是使人与机器可以通过自然语言进行对话交互的系统。DS除了用准确、简洁的自然语言回答用户用自然语言提出的问题外,更注重与人的交互、对人意图的理解、对对话氛围的感知,以及回答的多样性和个性化。

网络异常,图片无法展示
|


分类


交互模式

按交互模型划分为文本客服机器人和语音客服机器人。

文本客服机器人

主要包含NLU、DM、NLG等技术

语音客服机器人

除了NLU、DM、NLG等技术之外,还包含ASR、TTS。

场景和功能类型

问答型机器人

问答机器人主要依托于强大的知识库,可对用户提出的问题给出特定回复。对回复内容的准确性要求高,但仅限于一问一答的单轮对话交互,对上下文信息不作处理,目前多用于客服领域。

基于检索匹配的问答技术

基于检索匹配的问答技术通过语义匹配的方式从给定的问答数据集中找出最相似的问题并给出答案。这种方式简单有效,针对问题和答案相对固定的业务场景,通常能够实现较好的对话效果。


网络异常,图片无法展示
|


基于阅读理解的问答技术

基于阅读理解(Document Understanding,DU)的问答技术旨在围绕给定篇章文档内容完成问答任务。具体而言,该技术面向给定的一篇或若干篇文档,对于用户对话中提出的与文档相关的问题给出正确的回答。该技术主要通过问题理解、段落排序和机器阅读理解等几个主要技术流程实现。

在基于阅读理解的问答技术中,让机器能够阅读自然语言文本,然后回答相关问题的机器阅读理解是核心,也是提升基于阅读理解的对话效果的关键。

网络异常,图片无法展示
|


任务型机器人

机器人通过多轮对话交互满足用户某一特定任务需求。对任务完成度要求高,其中机器人主要通过对话状态追踪、问槽、澄清等理解用户意图,然后进行回复或调用API等形式完成用户任务需求,如订票、订餐等任务。

实现技术

任务型对话系统目前主要有两种实现技术,一种是基于流水线(pipeline)的实现方式,另一种是基于端到端(end-to-end)的实现方式。

网络异常,图片无法展示
|


流水线(pipeline)

网络异常,图片无法展示
|


实现的对话系统的经典结构图,又称规则对话系统。

整个系统有四大核心模块,分别由NLU、DST、DPL和NLG依次串联构成的一条流水线,各模块可独立设计,模块间协作完成任务型对话。

  1. 自然语言理解(NLU):主要对人机交互过程中产生的对话进行语义理解;
  2. 对话状态跟踪器(DST):管理每一轮对话状态,包括历史状态记录及当前状态输出;
  3. 对话策略(DPL):基于当前对话状态执行的下一步系统回应策略;
  4. 自然语言生成(NLG):将对话策略输出的语义转化成自然语言。
端到端(end-to-end)

网络异常,图片无法展示
|


端到端(end-to-end)的对话系统,主要是结合深度学习技术。采用数据模型驱动,通过海量数据训练,挖掘出从用户自然语言输入到系统自然语言输出的整体映射关系,而忽略中间过程的一种方法。

就目前工业界整体应用而言,虽然端到端(end-to-end)的方法灵活性和可拓展性较高,但其对数据的质量和数量要求也很高,同时还存在不可控性和不可解释性等问题,因此工业界的对话系统目前大多采用的还是基于规则的流水线(pipeline)实现方式。

业务场景

任务式人机对话系统业务场景分为两大类型,即信息检索类服务满足类

信息检索类

信息检索类对话系统接收用户以语言形式发出的指令,经过对话理解、对话管理、指令执行和语言生成等环节,查询到用户所需信息并组织语言返回,如智能客服。

服务满足类

服务满足类对话系统的处理流程与信息检索类大致相同。不同之处在于,服务满足类对话系统通常不需要对用户进行自然语言形式的反馈,而是经过对话理解、对话管理和指令执行等环节完成用户发出的指令即可,如天猫精灵。

闲聊型机器人

机器人与用户互动比较开放,用户没有明确目的,机器人回复也没有标准答案。对回复内容的准确度不做要求,主要以趣味性和个性化的回复满足用户情感需求。

闲聊型智能对话的技术框架有两种主流形式,一是基于检索技术的聊天式对话系统,二是基于端到端技术聊天式系统。

基于检索技术的聊天系统

基于检索技术的聊天系统通常由检索模型、匹配模型和排序模型构成。对于给定的用户输入话语,首先由检索模型 在对话语料库中查找类似场景并返回多个候选对话问答对,然后由匹配模型判断候选问答对是否可以作为当前用 户话语的合理回复,最后由排序模型根据应用场景做一些适配定制后给出最终的回复。该系统由于可以直接使用 人类回复,因此在回复的通顺性和风趣性等方面占有优势,但由于缺乏自由度,无法生成从未存在过的新句子,因 此被认为不能达到理想状态的对话智能。

基于端到端建模技术的聊天系统

基于端到端建模技术的聊天系统 把对话问题当成翻译问题,将对话的上文看做源语言,将对话的下文看成目标语言,使用基于序列到序列的神经网络生成模型直接生成对话回复。对于给定的用户输入话语,端到端建模技术首 先使用编码器网络将该输入话语编码为中间语义表示,然后借助解码器网络将该中间语义表示逐步解码为对话回 复。端到端模型可以克服检索模型无法生成全新回复的缺陷,能够生成在对话实例库中从未出现过的回复,但由于 缺乏对用户话语和回复机制相应的干预,难以保证生成的回复富含信息并和上下文保持连贯性。

网络异常,图片无法展示
|


智能对话系统的商业和社会价值


行业级(B端)的价值提升

  • 金融业---问题咨询、外呼、工单管理等客服场景中。
  • 零售业---为用户提供个性化产品建议,并主动推送相关产品。
  • 制造业---嵌入智能对话系统,使用户可以控制具有对话式交互功能的电器设备。
  • 政务领域---智能终端可以通过多轮对话快速准确地引导群众定位办事流程,收审所需材料,大幅压缩了等待时间。

消费者(C端)的体验升级

  • 丰富数字生活---购物、烹饪、外卖、出行、家政、游戏、观影、健身等活动都可以借助语音助手等智能对话产品。
  • 助力儿童教育---在早教场景中,伴读机器人引导儿童阅读,在K12教育中,家教机器人能够帮助提升学习效率、丰富学习的趣味性。
  • 改善社会福利---通过智能语音穿戴设备随时监控老年人的身体状态,并接听语音指令下的电话呼叫以提供及时救助。“智能语音护理床”的出现使得患者可通过对话自行控制护理床状态。
  • 服务特殊群体---对于有视觉障碍和语言障碍的特殊群体来说,目前市场中的智能语音客服和语音助理为处理个人事务提供了便利。


相关文章
|
2月前
|
机器学习/深度学习 人工智能 自然语言处理
对话系统简介
对话系统简介
|
25天前
|
人工智能 自然语言处理 数据库
探索人工智能的世界:构建智能问答系统之实战篇
【6月更文挑战第8天】本文档介绍了如何使用Python进行Milvus数据库操作,包括环境安装、基本操作如连接数据库、创建集合、插入和查询向量数据、创建索引、删除数据等。此外,还展示了使用LangChain库与HuggingFaceEmbeddings集成,简化操作。最后,演示了如何结合openai模型定制交互式问答系统。整个过程旨在帮助读者理解如何将预训练模型与数据库集成以实现特定任务。
|
6天前
|
存储 数据采集 搜索推荐
使用Java实现智能推荐系统的关键技术
使用Java实现智能推荐系统的关键技术
|
2月前
|
机器学习/深度学习 人工智能 NoSQL
【AIGC】深入浅出理解检索增强技术(RAG)
【5月更文挑战第10天】本文介绍了检索增强生成(RAG)技术,这是一种将AI模型与内部数据结合,提升处理和理解能力的方法。通过实时从大型文档库检索信息,扩展预训练语言模型的知识。文章通过示例说明了当模型需要回答未公开来源的内容时,RAG如何通过添加上下文信息来增强模型的回答能力。讨论了实际应用中令牌限制和文本分块的问题,以及使用文本嵌入技术解决相关性匹配的挑战。最后,概述了实现RAG的步骤,并预告后续将分享构建检索增强服务的详情。
207 3
|
2月前
|
存储 SQL 自然语言处理
RAG技术全解析:打造下一代智能问答系统
一、RAG简介 大型语言模型(LLM)已经取得了显著的成功,尽管它们仍然面临重大的限制,特别是在特定领域或知识密集型任务中,尤其是在处理超出其训练数据或需要当前信息的查询时,常会产生“幻觉”现象。为了克服这些挑战,检索增强生成(RAG)通过从外部知识库检索相关文档chunk并进行语义相似度计算,增强了LLM的功能。通过引用外部知识,RAG有效地减少了生成事实不正确内容的问题。RAG目前是基于LLM系统中最受欢迎的架构,有许多产品基于RAG构建,使RAG成为推动聊天机器人发展和增强LLM在现实世界应用适用性的关键技术。 二、RAG架构 2.1 RAG实现过程 RAG在问答系统中的一个典型
220 2
|
2月前
|
机器学习/深度学习 人工智能 搜索推荐
【AI 初识】解释推荐系统的概念
【5月更文挑战第3天】【AI 初识】解释推荐系统的概念
|
2月前
|
机器学习/深度学习 自然语言处理 知识图谱
万字综述:2023年多模态检索增强生成技术(mRAG)最新进展与趋势-图片、代码、图谱、视频、声音、文本
综述多模态检索增强生成技术(mRAG)最新进展与趋势-图片、代码、图谱、视频、声音、文本。
|
2月前
|
人工智能 自然语言处理 搜索推荐
【AGI】智能体简介及场景分析
【4月更文挑战第14天】AI时代,智能体的意义,使用场景及对未来的意义
82 1
|
2月前
|
机器学习/深度学习 自然语言处理 语音技术
语音识别技术的原理与应用
语音识别技术的原理与应用
|
10月前
|
机器学习/深度学习 人工智能 自然语言处理
NLP机器翻译全景:从基本原理到技术实战全解析
NLP机器翻译全景:从基本原理到技术实战全解析
96 0