UniMS-RAG:用于个性化对话的统一多源RAG框架

简介: RAG领域已经取得了相当大的发展,这篇论文的是如何分解RAG过程,加入多文件检索、记忆和个人信息等定制化的元素。

大型语言模型(llm)在自然语言任务中表现出色,但在对话系统中的个性化和上下文方面面临挑战。这个研究提出了一个统一的多源检索-增强生成系统(UniMS-RAG),通过将任务分解为知识来源选择、知识检索和响应生成来解决个性化问题。

这个系统包括一个自我改进的机制,这个机制基于响应和检索证据之间的一致性分数迭代地改进生成的响应。实验结果表明,UniMS-RAG在知识来源选择和响应生成任务方面具有先进的性能。

上图展示了两个场景,其中用户和机器人角色是独立的,而在第二个示例中则是相互依赖的。对于相互依赖的方法,需要有评估令牌和代理令牌。

论文要点

1、知识来源选择

智能和准确的知识来源选择和对多个信息来源综合成一个连贯而简洁的答案将变得至关重要。

使用RAG的一个优点是其实现的简单。但是在agenic RAG、多文档搜索和添加会话历史等方面,还需要很多的手动工作。代理RAG是将代理层次结构与RAG实现相结合的地方,这会带来很大的复杂性。

2、个性化与情境

个性化和通过会话历史维护上下文是优秀用户体验的重要元素。UniMS-RAG会对这些元素进行优先排序。

3、持续改进

论文的方法还包括一种自我细化推理算法,通过结合RAG会带来很大程度的可检查性和可观察性。

UniMS-RAG框架

UniMS-RAG统一了计划、检索和阅读任务的训练过程,并将它们集成到一个综合框架中。利用大型语言模型(llm)的力量来利用外部知识来源,UniMS-RAG增强了llm在个性化知识基础对话中无缝连接各种资源的能力。这种集成简化了传统上分离的检索器和训练任务,并允许以统一的方式进行自适应证据检索和相关性评分评估。

下图是所提出的称为UniMS-RAG的方法的说明。

精心设计了三个优化任务:

Knowledge Source Selection:知识来源选择在给定不同来源之间的关系的情况下,创建一系列应该使用哪些特定知识来源的决策的过程。

Relevance Score Prediction:相关性评分预测会根据决策从外部数据库检索前n个结果。

Response Generation:最终将所有检索到的知识合并到最终的响应,生成结果

总结

论文提出的方法可在多源环境中解决个性化的基于知识的对话任务,将问题分解为三个子任务:知识库选择、知识检索和响应生成。提出的统一多源检索-增强对话系统(UniMS-RAG)使用大型语言模型(llm)同时作为计划者、检索者和读者。

这个框架在推理过程中还引入了自改进,使用一致性和相似性分数来改进响应。

在两个数据集上的实验结果表明,UniMS-RAG产生了更加个性化和真实的反应,优于基线模型。

论文地址:

https://avoid.overfit.cn/post/93a42fde82df483d8d64e286eb3a726a

作者:Cobus Greyling

目录
相关文章
|
Linux Shell 数据安全/隐私保护
使用 useradd 命令创建新用户
在Linux中创建新用户使用`useradd`命令。打开终端,以`sudo`运行`useradd [选项] 用户名`创建用户,如`sudo useradd newuser`。接着,使用`sudo passwd newuser`设置密码。要添加用户到其他组,如`sudo`组,用`sudo usermod -aG sudo newuser`。验证用户创建可执行`id newuser`。更多配置选项可查看`man useradd`或`useradd --help`。
696 3
|
机器学习/深度学习 人工智能 自然语言处理
PeterCat:一键创建开源项目 AI 问答机器人,自动抓取 GitHub 仓库信息、文档和 issue 等构建知识库
PeterCat 是一款开源的智能答疑机器人,能够自动抓取 GitHub 上的文档和 issue 构建知识库,提供对话式答疑服务,帮助开发者和社区维护者高效解决技术问题。
903 7
PeterCat:一键创建开源项目 AI 问答机器人,自动抓取 GitHub 仓库信息、文档和 issue 等构建知识库
|
11月前
|
存储 人工智能 JSON
Open-Deep-Research:开源复现版 Deep Research,支持切换多种大模型,不再依赖 OpenAI o3
Open Deep Research 是一个开源的 AI 智能体,支持多种语言模型,具备实时数据提取、多源数据整合和AI推理功能。
2497 16
|
API Docker Windows
2024 Ollama 一站式解决在Windows系统安装、使用、定制服务与实战案例
这篇文章是一份关于Ollama工具的一站式使用指南,涵盖了在Windows系统上安装、使用和定制服务,以及实战案例。
2024 Ollama 一站式解决在Windows系统安装、使用、定制服务与实战案例
|
关系型数据库 MySQL 数据库
【赵渝强老师】MySQL的参数文件
MySQL启动时会读取配置文件my.cnf来确定数据库文件位置及初始化参数。该文件分为Server和Client两部分,包含动态与静态参数。动态参数可在运行中通过命令修改,而静态参数需修改my.cnf并重启服务生效。文中还提供了相关代码示例和视频教程。
311 6
|
JavaScript
如何查看Vue使用的版本
这篇文章介绍了如何在项目中查看Vue及其相关库的版本信息,比如element-ui和element-china-area-data。要查看Vue的版本,需要查看项目中的`package.json`文件,在`dependencies`部分可以找到Vue的版本号。如果需要查询不同版本的兼容性,可以访问相应的官方文档或资源网站。
|
负载均衡 应用服务中间件 nginx
nginx配置kibana访问用户名和密码认证、及无认证访问配置
nginx配置kibana访问用户名和密码认证、及无认证访问配置
771 0
|
监控 网络协议 Linux
centos常见的命令
【5月更文挑战第8天】了解和掌握基本的CentOS命令对于服务器管理至关重要。本文介绍了19个常用命令,包括`ls`、`cd`、`mkdir`、`rm`、`grep`、`find`、`sudo`、`vi/vim`、`cp/mv`、`du/df`、`history`、`top/htop`、`ps`、`netstat/ss`、`yum/dnf`、`ssh`、`iptables`、`journalctl`、`crontab`和`systemctl`。每个命令都提到了常见问题、使用技巧和避免错误的方法,帮助用户更好地管理和维护CentOS系统。
548 0
|
缓存 中间件 测试技术
【基础理论-中间件测试】引入中间件
【基础理论-中间件测试】引入中间件
1219 95