检索式人机对话|学习笔记

简介: 快速学习检索式人机对话

开发者学堂课程【达摩院智能语音交互 - 人机对话技术浅析检索式人机对话】学习笔记,与课程紧密联系,让用户快速学习知识。

课程地址https://developer.aliyun.com/learning/course/854/detail/14078


检索式人机对话


内容介绍:

一、检索式人机对话

二、人机对话的三类常用方法

三、基于 ESIM 的多轮回复选择和 DSTC7 Track1

一、检索式人机对话

是客服聊天机器人中最常用的方法

1.按使用场景划分

1)单轮回复选择

给定用户的单轮 query ,机器在候选集中选择正确回复,如普通的搜索引擎。

(2)多轮回复选择

给定用户的多轮对话历史,机器在候选集中选择正确回复

多轮回复选择有更强的数据信息,不仅需要考虑用户之前输入的信息,还需要考虑机器本身之前的信息。

如图,下图是客服场景下的多轮对话的例子::

image.png

客户首先会问299的湿巾和399的湿巾有什么区别,然后机器会回答材质一样的大小不同,用户又会问哦299的有5包80抽399的才4包72抽,此时用户已经明白两种湿巾的差别,然后机器需要从 n 个不同的回答中选择最优的答案作为回复,这里机器选择的是一种是大包的一种是小包的亲看一下哦,也就是最优答复。


二、人机对话的三类常用方法

1.基于句子编码的方法

1)基于人工特征的方法,如:TF-IDF

(2)基于神经网络的方法,如:RNN,CNN,LSTM,BiLSTM

(3)优点:速度较快。

2.基于序列匹配的方法

(1)

Mv-LSTM,Matching-LSTM,Attentive-LSTM,Multi-Channels

(2)ESIM 模型(Chen et al,2019)

(3)优点:有较高准确率,其中 ESIM 模型是目前 SOTA

3.基于层级建模的方法

(1)Multi-View,DL2R,SMN,DUA,DAM

(2)优点:能显式建模 token-level 和 utterance-level 信息


三、基于 ESIM 的多轮回复选择和 DSTC7 Track1

1. 基于 ESIM 的多轮回复选择

(1)在第七届对话系统技术挑战赛(DSTC7 Track1)包揽了两项冠军。

如图:

image.png

可以看到,阿里在众多知名院校如麻省理工学院等中脱颖而出,拿到了七

(2)ESIM 模型打破了之前基于层级的方法优于基于序列的方法的规律,证明了:基于序列的方法>基于层级的方法。

(3)为了回馈业界,阿里将 ESIM 的代码开源公布:

http://github.com/alibaba/esim-response-selection

2. DSTC7 Track1 任务介绍

DSTC 是由微软研究院于2013年发起的一项比赛。

(1)任务目标

①要求参赛模型根据给定多轮对话历史,在百或者上万个候选集中选择正确回复

(2)两个硬性规则

①参赛系统不能使用基于规则的特征或系统。

②不能使用除了词向量以外的额外的标注或未标注的预料。

(3)比赛分为两个数据集,所以会决定两个冠军。

Ubuntu 数据集(规模较大,更多样化)

Advising 数据集(规模较小,更集中)

(4)两个数据集实例

给定一个多轮对话历史,参赛模型需从候选集中选择出正确回复,根据任务的不同,候选集的数量不同,有的是一百个,有的是上万个,有的还可以使用官方的知识文本。

3.ESIM 原理简介

(1)是一种用于句子对分类问题的主流模型,最早用于自然语言推理任务(Chen et al,2017)

自然语言推理任务指通过模型从一句话推理出另外一句话,是一种典型的对句子分态任务,ESTM 模型已经获得页面大规模关注,被称为是匹配的利器。

详情可见下图:

image.png

(2)ESTM 模型主要由三个部分组成

①输入编码:word embedding,BiLSTM encoders

②局部匹配:dot product attention,heuristic matching

③匹配组合:用 BiLSTM,MLP classifier 进行分类

4.ESIM 与之前的 SOTA 方法比较

1)在两个公开的大规模数据上取得了新的 SOTA

①在zUbuntu(Lowe et al.2015)中获得了2.9%R@1的绝对提升

②在E-commerce(Zhang et al.2018)获得了6.9%onR@1的绝对提升

详情可见下图:

image.png

相关文章
|
SQL 人工智能 分布式计算
基于阿里云PAI平台搭建知识库检索增强的大模型对话系统
基于原始的阿里云计算平台产技文档,搭建一套基于大模型检索增强答疑机器人。本方案已在阿里云线上多个场景落地,将覆盖阿里云官方答疑群聊、研发答疑机器人、钉钉技术服务助手等。线上工单拦截率提升10+%,答疑采纳率70+%,显著提升答疑效率。
|
2月前
|
人工智能 自然语言处理 数据挖掘
RAG 系统高效检索提升秘籍:如何精准选择 BGE 智源、GTE 阿里与 Jina 等的嵌入与精排模型的完美搭配
RAG 系统高效检索提升秘籍:如何精准选择 BGE 智源、GTE 阿里与 Jina 等的嵌入与精排模型的完美搭配
RAG 系统高效检索提升秘籍:如何精准选择 BGE 智源、GTE 阿里与 Jina 等的嵌入与精排模型的完美搭配
|
3月前
|
机器学习/深度学习 自然语言处理 算法
超越传统搜索:探索基于GraphRAG的信息检索新范式
【10月更文挑战第10天】随着信息爆炸时代的到来,如何从海量的数据中快速准确地找到所需的信息成为了一个亟待解决的问题。传统的信息检索系统主要依赖于关键词匹配和文档排名算法来提供结果,但这种方法往往无法捕捉到数据间的复杂关系,也无法很好地理解用户的查询意图。近年来,一种新的信息检索方法——基于图的检索增强生成(Graph-based Retrieval-Augmented Generation, GraphRAG)应运而生,它通过结合知识图谱与机器学习技术,为信息检索带来了全新的视角。
101 1
|
2月前
|
人工智能 自然语言处理 搜索推荐
AI与心理健康:情感支持的新形式
【10月更文挑战第31天】在快节奏的现代生活中,心理健康问题日益突出。AI技术的发展为情感支持提供了新形式,包括心理评估、情感监测、危机干预和个性化咨询。本文探讨了AI在心理健康领域的应用及其对个人和社会的深远影响。
|
5月前
|
机器学习/深度学习 人工智能 搜索推荐
【颠覆传统】解锁记忆新姿势:多模态AI单词助记神器——让单词学习变得生动有趣,打造个性化学习新体验!
【8月更文挑战第21天】多模态AI单词助记模型融合文本、语音与图像,增强英语单词记忆效果。设计上利用多感官刺激提升信息处理与记忆效率。技术栈包括React.js前端、Node.js后端、PyTorch深度学习框架等。实现过程涵盖数据准备、前端开发、后端服务搭建、深度学习模型构建及用户反馈循环。应用显示该模型显著提高学习兴趣与记忆效率,尤其对视觉和听觉学习者有益,个性化推荐系统进一步优化学习体验。
197 0
|
8月前
|
人工智能 自然语言处理 Cloud Native
向量检索服务在语义检索、知识库搭建、AI多模态搜索等场景中有着广泛的应用
向量检索服务在语义检索、知识库搭建、AI多模态搜索等场景中有着广泛的应用
261 0
|
8月前
|
存储 人工智能 自然语言处理
【RAG】人工智能:检索增强(RAG)六步学习法
【5月更文挑战第1天】人工智能检索增强学习六步基本介绍
235 4
|
人工智能 关系型数据库 Serverless
向量加成,AI 知识库问答应用
AI 知识库问答应用使用函数计算 X RDS PostgreSQL,基于ChatGLM6B 提供的能力,可以通过在线对话的方式与用户进行交互,接收用户的问题,并根据问题内容做出相应的回答。
207 344
|
8月前
|
机器学习/深度学习 运维 算法
机器学习的魔法(三)解析无监督学习的黑科技,揭秘新闻话题背后的神奇算法
机器学习的魔法(三)解析无监督学习的黑科技,揭秘新闻话题背后的神奇算法
101 0
|
存储 人工智能 关系型数据库
向量加成,基于 LLM 构建AI知识库问答应用
向量加成,基于 LLM 构建AI知识库问答应用
330 43