多轮问答|学习笔记

简介: 快速学习多轮问答

开发者学堂课程【阿里小蜜中的开放语聊技术:多轮问答】学习笔记,与课程紧密联系,让用户快速学习知识。

课程地址https://developer.aliyun.com/learning/course/44/detail/974


多轮问答


基于关键词识别

现在介绍最后一部分的内容,多轮问答。这里的多轮问答并不是利用模型直接给出答案的结果,而是利用问题重写的方式,结合用户的历史问题以及当前的问题,整体的看用户到底表达什么意思,再根据多轮问题重写的结果,利用文本匹配模型,做单轮的文本匹配,从知识库中得到合理回复。

所以重点在问题重写的这一部分,设计出基于关键词识别和问题重写多任务学习的训练方式。

image.png

看一下训练方式的简图,左下角是对用户历史问题做语义表示的部分。可以采用不同神经网络的结构进行,例如 RNN 或双向的 STM 等。在此语义表示的基础上做关键词识别的词语分类,识别用户问题中哪些词语是比较重要的用词,可以使用常用的分类模型,例如 CNN ,或是利用序列标注模型进行关键词与非关键词的分别标注。

然后使用用户历史问题的语义表示以及关键词抽取结果的关键词,语义信息作为整体的语音输入,用于生成问题改写的结果,也就是考虑了用户当前的问题,以及上文的历史问题,综合来看用户真正问题是什么。实际上是有两个过程,一个是关键词识别,另一个是问题改写。这里将两个任务放在一起做多任务学习的方式进行,希望利用这种方法得到效果比较好的模型结果。

这里和其他常见的问题重写模型做了简单的效果对比。针对问题改写的常见模型,最常规的 six to sequence ,以及 A4L2016 的一篇文章中有人提出 copy night 模型。

设计了一种词语的 copy 机制,把词语从原来的句子中保留下来,这种靠替代的方法最开始是用来做文本摘要,也可以属于一种文本重写的模型,主要和这两种模型做了效果对比。另外自己的模型也尝试了将关键词识别和问题重写这两个任务进行分别训练的方式。最后为了实验结果验证,提出的关键词识别和问题重写相结合的方法比 six to sequence 和 copy night 的两种模型效果都要好。

关键词识别和问题重写进行多任务学习的方式效果,也是比两个任务单独进行的方式效果好。

相关文章
|
2月前
|
人工智能 UED
通义语音AI技术问题之预训练语言模型的主题分割效果的提升如何解决
通义语音AI技术问题之预训练语言模型的主题分割效果的提升如何解决
24 5
|
2月前
|
人工智能 算法
通义语音AI技术问题之预训练语言模型句子嵌入存在的各向异性问题如何解决
通义语音AI技术问题之预训练语言模型句子嵌入存在的各向异性问题如何解决
22 5
|
2月前
|
机器学习/深度学习 搜索推荐 算法
个性化音色定制:FunAudioLLM 的用户偏好学习机制
【8月更文第28天】随着语音合成技术的发展,越来越多的应用程序允许用户定制自己喜爱的声音类型。FunAudioLLM 是一个虚构的语音合成框架,它利用机器学习算法来适应用户的个人偏好,从而生成更加个性化的音色。本文将介绍 FunAudioLLM 如何通过用户偏好学习机制来调整和优化声音输出,并提供一些示例代码。
41 0
|
3月前
|
自然语言处理 并行计算 Python
千问大模型对话
该段Python代码演示了如何使用`modelscope`库加载预训练的因果语言模型`Qwen2-1___5B-Instruct`到CUDA设备,并进行文本生成。首先,它定义了设备为`cuda`,然后加载模型和分词器。接着,设置了一个聊天情境并准备输入文本。通过调用`tokenizer.apply_chat_template`处理输入,然后将处理后的文本转化为模型输入张量并传入设备。使用`model.generate`方法生成新的文本,截取生成的输出并解码为人类可读的字符串。最后,打印出生成的响应。
109 6
|
5月前
|
机器学习/深度学习 人工智能 自然语言处理
【大模型】如何利用 LLM 来创建更像人类的对话?
【5月更文挑战第7天】【大模型】如何利用 LLM 来创建更像人类的对话?
|
5月前
|
人工智能 安全 搜索推荐
与AI对话的艺术:如何优化Prompt以获得更好的响应反馈
与AI对话的艺术:如何优化Prompt以获得更好的响应反馈
|
Kubernetes Java 大数据
每日一个 ChatGPT 使用小技巧系列之3 - 利用角色扮演提高 ChatGPT 回复的质量
每日一个 ChatGPT 使用小技巧系列之3 - 利用角色扮演提高 ChatGPT 回复的质量
|
机器学习/深度学习 Web App开发 存储
偏好强化学习概述
偏好强化学习概述
664 0
|
人工智能 自然语言处理 搜索推荐
ChatGPT 有哪些有趣的玩法?
ChatGPT 有哪些有趣的玩法?
139 0
|
监控 Oracle 关系型数据库
ChatGPT几个有趣的玩法
ChatGPT几个有趣的玩法
176 0