简述智能对话系统

本文涉及的产品
NLP自然语言处理_基础版,每接口每天50万次
NLP 自学习平台,3个模型定制额度 1个月
NLP自然语言处理_高级版,每接口累计50万次
简介: 对话系统(Dialogue System,简称DS),是使人与机器可以通过自然语言进行对话交互的系统。DS除了用准确、简洁的自然语言回答用户用自然语言提出的问题外,更注重与人的交互、对人意图的理解、对对话氛围的感知,以及回答的多样性和个性化。

综述


对话系统(Dialogue System,简称DS),是使人与机器可以通过自然语言进行对话交互的系统。DS除了用准确、简洁的自然语言回答用户用自然语言提出的问题外,更注重与人的交互、对人意图的理解、对对话氛围的感知,以及回答的多样性和个性化。

网络异常,图片无法展示
|


分类


交互模式

按交互模型划分为文本客服机器人和语音客服机器人。

文本客服机器人

主要包含NLU、DM、NLG等技术

语音客服机器人

除了NLU、DM、NLG等技术之外,还包含ASR、TTS。

场景和功能类型

问答型机器人

问答机器人主要依托于强大的知识库,可对用户提出的问题给出特定回复。对回复内容的准确性要求高,但仅限于一问一答的单轮对话交互,对上下文信息不作处理,目前多用于客服领域。

基于检索匹配的问答技术

基于检索匹配的问答技术通过语义匹配的方式从给定的问答数据集中找出最相似的问题并给出答案。这种方式简单有效,针对问题和答案相对固定的业务场景,通常能够实现较好的对话效果。


网络异常,图片无法展示
|


基于阅读理解的问答技术

基于阅读理解(Document Understanding,DU)的问答技术旨在围绕给定篇章文档内容完成问答任务。具体而言,该技术面向给定的一篇或若干篇文档,对于用户对话中提出的与文档相关的问题给出正确的回答。该技术主要通过问题理解、段落排序和机器阅读理解等几个主要技术流程实现。

在基于阅读理解的问答技术中,让机器能够阅读自然语言文本,然后回答相关问题的机器阅读理解是核心,也是提升基于阅读理解的对话效果的关键。

网络异常,图片无法展示
|


任务型机器人

机器人通过多轮对话交互满足用户某一特定任务需求。对任务完成度要求高,其中机器人主要通过对话状态追踪、问槽、澄清等理解用户意图,然后进行回复或调用API等形式完成用户任务需求,如订票、订餐等任务。

实现技术

任务型对话系统目前主要有两种实现技术,一种是基于流水线(pipeline)的实现方式,另一种是基于端到端(end-to-end)的实现方式。

网络异常,图片无法展示
|


流水线(pipeline)

网络异常,图片无法展示
|


实现的对话系统的经典结构图,又称规则对话系统。

整个系统有四大核心模块,分别由NLU、DST、DPL和NLG依次串联构成的一条流水线,各模块可独立设计,模块间协作完成任务型对话。

  1. 自然语言理解(NLU):主要对人机交互过程中产生的对话进行语义理解;
  2. 对话状态跟踪器(DST):管理每一轮对话状态,包括历史状态记录及当前状态输出;
  3. 对话策略(DPL):基于当前对话状态执行的下一步系统回应策略;
  4. 自然语言生成(NLG):将对话策略输出的语义转化成自然语言。
端到端(end-to-end)

网络异常,图片无法展示
|


端到端(end-to-end)的对话系统,主要是结合深度学习技术。采用数据模型驱动,通过海量数据训练,挖掘出从用户自然语言输入到系统自然语言输出的整体映射关系,而忽略中间过程的一种方法。

就目前工业界整体应用而言,虽然端到端(end-to-end)的方法灵活性和可拓展性较高,但其对数据的质量和数量要求也很高,同时还存在不可控性和不可解释性等问题,因此工业界的对话系统目前大多采用的还是基于规则的流水线(pipeline)实现方式。

业务场景

任务式人机对话系统业务场景分为两大类型,即信息检索类服务满足类

信息检索类

信息检索类对话系统接收用户以语言形式发出的指令,经过对话理解、对话管理、指令执行和语言生成等环节,查询到用户所需信息并组织语言返回,如智能客服。

服务满足类

服务满足类对话系统的处理流程与信息检索类大致相同。不同之处在于,服务满足类对话系统通常不需要对用户进行自然语言形式的反馈,而是经过对话理解、对话管理和指令执行等环节完成用户发出的指令即可,如天猫精灵。

闲聊型机器人

机器人与用户互动比较开放,用户没有明确目的,机器人回复也没有标准答案。对回复内容的准确度不做要求,主要以趣味性和个性化的回复满足用户情感需求。

闲聊型智能对话的技术框架有两种主流形式,一是基于检索技术的聊天式对话系统,二是基于端到端技术聊天式系统。

基于检索技术的聊天系统

基于检索技术的聊天系统通常由检索模型、匹配模型和排序模型构成。对于给定的用户输入话语,首先由检索模型 在对话语料库中查找类似场景并返回多个候选对话问答对,然后由匹配模型判断候选问答对是否可以作为当前用 户话语的合理回复,最后由排序模型根据应用场景做一些适配定制后给出最终的回复。该系统由于可以直接使用 人类回复,因此在回复的通顺性和风趣性等方面占有优势,但由于缺乏自由度,无法生成从未存在过的新句子,因 此被认为不能达到理想状态的对话智能。

基于端到端建模技术的聊天系统

基于端到端建模技术的聊天系统 把对话问题当成翻译问题,将对话的上文看做源语言,将对话的下文看成目标语言,使用基于序列到序列的神经网络生成模型直接生成对话回复。对于给定的用户输入话语,端到端建模技术首 先使用编码器网络将该输入话语编码为中间语义表示,然后借助解码器网络将该中间语义表示逐步解码为对话回 复。端到端模型可以克服检索模型无法生成全新回复的缺陷,能够生成在对话实例库中从未出现过的回复,但由于 缺乏对用户话语和回复机制相应的干预,难以保证生成的回复富含信息并和上下文保持连贯性。

网络异常,图片无法展示
|


智能对话系统的商业和社会价值


行业级(B端)的价值提升

  • 金融业---问题咨询、外呼、工单管理等客服场景中。
  • 零售业---为用户提供个性化产品建议,并主动推送相关产品。
  • 制造业---嵌入智能对话系统,使用户可以控制具有对话式交互功能的电器设备。
  • 政务领域---智能终端可以通过多轮对话快速准确地引导群众定位办事流程,收审所需材料,大幅压缩了等待时间。

消费者(C端)的体验升级

  • 丰富数字生活---购物、烹饪、外卖、出行、家政、游戏、观影、健身等活动都可以借助语音助手等智能对话产品。
  • 助力儿童教育---在早教场景中,伴读机器人引导儿童阅读,在K12教育中,家教机器人能够帮助提升学习效率、丰富学习的趣味性。
  • 改善社会福利---通过智能语音穿戴设备随时监控老年人的身体状态,并接听语音指令下的电话呼叫以提供及时救助。“智能语音护理床”的出现使得患者可通过对话自行控制护理床状态。
  • 服务特殊群体---对于有视觉障碍和语言障碍的特殊群体来说,目前市场中的智能语音客服和语音助理为处理个人事务提供了便利。


相关文章
|
7月前
|
机器学习/深度学习 人工智能 自然语言处理
对话系统简介
对话系统简介
|
机器学习/深度学习 人工智能 自然语言处理
自然语言生成技术介绍与应用
自然语言生成技术介绍与应用
152 0
|
机器学习/深度学习 人工智能 自然语言处理
浅析人机对话系统的主要模块及核心技术
之前,在我的另一篇博客:简述智能对话系统 里面概述了对话系统的分类、应用场景及产生的社会价值。今天,来简单讲述一下对话系统的主要模块与核心技术。
|
11天前
|
机器学习/深度学习 人工智能 文字识别
Kimi 上线视觉思考模型,K1 系列强化学习模型正式开放,无需借助外部 OCR 处理图像与文本进行思考并回答
k1视觉思考模型是kimi推出的k1系列强化学习AI模型,具备端到端图像理解和思维链技术,能够在数学、物理、化学等领域表现优异。本文详细介绍了k1视觉思考模型的功能、技术原理、使用方法及其在多个应用场景中的表现。
148 68
Kimi 上线视觉思考模型,K1 系列强化学习模型正式开放,无需借助外部 OCR 处理图像与文本进行思考并回答
|
2月前
|
机器学习/深度学习 人工智能 小程序
【一步步开发AI运动小程序】三、运动识别处理流程
随着人工智能技术的发展,阿里体育等公司推出的“乐动力”、“天天跳绳”等AI运动APP备受关注。本文将引导您从零开始开发一个AI运动小程序,使用“云智AI运动识别小程序插件”。文章介绍了视频帧、帧率FPS、抽帧和人体识别等基本概念,并详细说明了处理流程,包括抽帧、人体识别检测、骨骼图绘制和运动分析等步骤。下篇将介绍如何在小程序中实现抽帧。
|
4月前
|
机器学习/深度学习 人工智能 自然语言处理
【深度学习】AudioLM音频生成模型概述及应用场景,项目实践及案例分析
AudioLM(Audio Language Model)是一种基于深度学习的音频生成模型,它使用自回归或变分自回归的方法来生成连续的音频信号。这类模型通常建立在Transformer架构或者类似的序列到序列(Seq2Seq)框架上,通过学习大量音频数据中的统计规律,能够生成具有高保真度和创造性的音频片段。AudioLM模型不仅能够合成音乐、语音,还能生成自然界的声音、环境噪声等,其应用广泛,涵盖了娱乐、教育、辅助技术、内容创作等多个领域。
128 1
|
5月前
|
存储 人工智能 自然语言处理
多模态RAG:三步构建图文并茂的智能问答、电商导购助手
本文介绍了如何使用OpenSearch LLM智能问答版,三步搭建一站式多模态RAG系统。
1080 9
|
6月前
|
人工智能 自然语言处理 决策智能
超长小说可以用AI翻译了,新型多智能体协作系统媲美人工翻译
【6月更文挑战第11天】研究人员开发了一种基于大型语言模型的多智能体协作系统TransAgents,用于文学翻译,挑战复杂的文学文本翻译。通过单语人类偏好和双语LLM偏好评估,系统在保留文学风格和表达上表现出色,尤其在需要领域知识的文本中。然而,系统在捕捉文学翻译的细微差别、文化特定元素和长文本翻译效率上仍有局限性。相关论文链接:https://arxiv.org/abs/2405.11804
179 1
|
7月前
|
存储 SQL 自然语言处理
RAG技术全解析:打造下一代智能问答系统
一、RAG简介 大型语言模型(LLM)已经取得了显著的成功,尽管它们仍然面临重大的限制,特别是在特定领域或知识密集型任务中,尤其是在处理超出其训练数据或需要当前信息的查询时,常会产生“幻觉”现象。为了克服这些挑战,检索增强生成(RAG)通过从外部知识库检索相关文档chunk并进行语义相似度计算,增强了LLM的功能。通过引用外部知识,RAG有效地减少了生成事实不正确内容的问题。RAG目前是基于LLM系统中最受欢迎的架构,有许多产品基于RAG构建,使RAG成为推动聊天机器人发展和增强LLM在现实世界应用适用性的关键技术。 二、RAG架构 2.1 RAG实现过程 RAG在问答系统中的一个典型
638 2
|
7月前
|
人工智能 自然语言处理 搜索推荐
【AGI】智能体简介及场景分析
【4月更文挑战第14天】AI时代,智能体的意义,使用场景及对未来的意义
191 1