MiniRAG:迷你 RAG 系统加成小型语言模型,爆发出与大型语言模型相当的性能

简介: MiniRAG 是香港大学推出的新型 RAG 系统,专为资源受限场景设计,支持高效知识检索与推理,适用于多种应用场景。

❤️ 如果你也关注 AI 的发展现状,且对 AI 应用开发非常感兴趣,我会每日分享大模型与 AI 领域的最新开源项目和应用,提供运行实例和实用教程,帮助你快速上手AI技术,欢迎关注我哦!

🥦 微信公众号|搜一搜:蚝油菜花 🥦


🚀 快速阅读

  1. 高效检索:基于异构图索引机制,快速从大量数据中检索相关知识。
  2. 轻量级设计:专为小型语言模型设计,降低计算和存储需求。
  3. 强大推理:支持复杂推理任务,适用于多种应用场景。

正文(附运行示例)

MiniRAG 是什么

MiniRAG

MiniRAG 是香港大学推出的一种新型检索增强型生成(RAG)系统,专为在资源受限的场景下高效部署小型语言模型(SLMs)而设计。它通过语义感知的异构图索引机制和轻量级拓扑增强检索方法,显著降低了计算和存储需求。

MiniRAG 在实验中展现出与大型语言模型(LLMs)相当的性能,同时仅需 25% 的存储空间。该系统还提供了全面的基准数据集,用于评估轻量级 RAG 系统在现实设备场景下的表现,推动资源受限环境下高效、私密的 RAG 系统的发展。

MiniRAG 的主要功能

  • 高效的知识检索:基于独特的异构图索引机制,快速准确地从大量数据中检索出与用户查询最相关的知识。
  • 轻量级的模型兼容性:专为小型语言模型(SLMs)设计,显著降低对计算资源和存储空间的需求。
  • 强大的推理能力:借助查询引导的推理路径发现机制,处理复杂的、多步骤的推理任务。
  • 适应性强:适用于即时通讯、个人内容管理、本地文档检索等多种应用场景。

MiniRAG 的技术原理

  • 语义感知的异构图索引机制

    • 文本块节点(Vc):保留原始文本的上下文完整性,直接参与检索阶段。
    • 实体节点(Ve):从文本块中提取的关键语义元素,如事件、地点、时间引用和领域特定概念。
    • 实体-实体连接(Eα):捕捉命名实体之间的语义关系、层次结构和时空依赖关系。
    • 实体-文本块连接(Eβ):连接命名实体及其对应的上下文,保持上下文相关性和语义连贯性。
    • 边的语义描述:基于语言模型生成的描述,为连接的节点提供明确的关系上下文。
  • 轻量级拓扑增强检索方法

    • 查询语义映射:用实体提取和轻量级句子嵌入模型,将用户输入的查询与图索引数据进行对齐。
    • 查询驱动的推理路径发现:基于智能查询引导机制,在异构图中构建推理路径。
    • 拓扑增强的图检索:结合基于嵌入的相似性搜索和图结构的拓扑信息,识别与查询相关的高质量实体-实体连接。
    • 查询相关文本块的检索:基于实体-文本块连接,收集与推理路径相关的文本块。
    • 融合增强生成:将检索到的关键关系和最优文本块与先前确定的答案节点进行整合,构建全面且结构化的输入表示。

如何运行 MiniRAG

安装

  • 从源码安装(推荐)
cd MiniRAG
pip install -e .
  • 从 PyPI 安装(代码基于 LightRAG,因此可以直接安装)
pip install lightrag-hku

快速开始

  • 所有复现代码可以在 ./reproduce 目录下找到。
  • 下载您需要的知识库数据集。
  • 将数据集放入 ./dataset 目录下。
  • Note:我们已经将 LiHua-World 数据集以 LiHuaWorld.zip 的形式放在了 ./dataset/LiHua-World/data/ 目录下。如果您想使用其他数据集,可以将其放在 ./dataset/xxx 目录下。

然后使用以下命令对数据集进行索引:

python ./reproduce/Step_0_index.py
python ./reproduce/Step_1_QA.py

或者,使用 ./main.py 中的代码初始化 MiniRAG。

资源


❤️ 如果你也关注 AI 的发展现状,且对 AI 应用开发非常感兴趣,我会每日分享大模型与 AI 领域的最新开源项目和应用,提供运行实例和实用教程,帮助你快速上手AI技术,欢迎关注我哦!

🥦 微信公众号|搜一搜:蚝油菜花 🥦

相关文章
|
11月前
|
人工智能 机器人
开源了一个项目,小🔥了一把
收集了github上1000个高质量的AI项目,包含了大模型,智能体,提示词工程,微调,模型,RAG,机器人,智能助理等,没想到一天就有这么多star了。
497 5
|
11月前
|
人工智能 API 数据库
Cognita:小白也能搭建 RAG 系统,提供交互界面的开源模块化 RAG 框架,支持多种文档检索技术
Cognita 是一个面向生产环境的开源模块化 RAG 框架,支持本地部署、无代码 UI 和增量索引,帮助开发者轻松构建和扩展生产级应用。
591 11
Cognita:小白也能搭建 RAG 系统,提供交互界面的开源模块化 RAG 框架,支持多种文档检索技术
|
11月前
|
数据采集 人工智能 自然语言处理
Riona-AI-Agent:自媒体 AI 代理!自动点赞、评论、个性化内容生成和发布等交互任务
Riona-AI-Agent 是一款基于 Node.js 和 TypeScript 的 AI 自动化工具,支持 Instagram、Twitter 等平台的自动化交互,生成高质量内容,提升社交媒体管理效率。
948 13
Riona-AI-Agent:自媒体 AI 代理!自动点赞、评论、个性化内容生成和发布等交互任务
|
11月前
|
人工智能 自然语言处理 数据处理
FlexRAG:不再局限于文本的 RAG!中科院开源多模态 RAG 助手,支持多数据类型、上下文压缩和多种检索器类型
FlexRAG 是中科院推出的高性能多模态 RAG 框架,支持多数据类型、上下文压缩和多模态数据处理,显著提升生成模型的表现。
1166 17
FlexRAG:不再局限于文本的 RAG!中科院开源多模态 RAG 助手,支持多数据类型、上下文压缩和多种检索器类型
|
11月前
|
人工智能 数据处理 语音技术
Pipecat实战:5步快速构建语音与AI整合项目,创建你的第一个多模态语音 AI 助手
Pipecat 是一个开源的 Python 框架,专注于构建语音和多模态对话代理,支持与多种 AI 服务集成,提供实时处理能力,适用于语音助手、企业服务等场景。
803 23
Pipecat实战:5步快速构建语音与AI整合项目,创建你的第一个多模态语音 AI 助手
|
11月前
|
人工智能 知识图谱 Docker
KAG:增强 LLM 的专业能力!蚂蚁集团推出专业领域知识增强框架,支持逻辑推理和多跳问答
KAG 是蚂蚁集团推出的专业领域知识服务框架,通过知识增强提升大型语言模型在特定领域的问答性能,支持逻辑推理和多跳事实问答,显著提升推理和问答的准确性和效率。
3279 46
KAG:增强 LLM 的专业能力!蚂蚁集团推出专业领域知识增强框架,支持逻辑推理和多跳问答
|
11月前
|
人工智能 开发框架 自然语言处理
Eko:一句话就能快速构建复杂工作流的 AI 代理开发框架!快速实现自动操作电脑和浏览器完成任务
Eko 是 Fellou AI 推出的开源 AI 代理开发框架,支持自然语言驱动,帮助开发者快速构建从简单指令到复杂工作流的智能代理。
1417 12
Eko:一句话就能快速构建复杂工作流的 AI 代理开发框架!快速实现自动操作电脑和浏览器完成任务
|
11月前
|
人工智能 自然语言处理 安全
微软phi-4来啦!小模型之光,14B科学、代码等能力超70B模型效果!
微软研究院的最新成果——Phi-4来啦!近日,微软公布了Phi家族的最新一代模型Phi-4的技术报告,模型同步开源,Phi-4建立在合成数据集、过滤后的公共领域网站数据以及获得的学术书籍和问答数据集的基础上,训练数据量为9.8 T tokens, 目标是确保小模型使用专注于高质量和高级推理的数据进行训练。
756 1
|
10月前
|
存储 缓存 自然语言处理
浏览量超 10w 的热图,描述 RAG 的主流架构
大模型性能的持续提升,进一步挖掘了 RAG 的潜力,RAG 将检索系统与生成模型相结合,带来诸多优势,如实时更新知识、降低成本等。点击本文,为您梳理 RAG 的基本信息,并介绍提升大模型生成结果的方法,快一起看看吧~
1163 107
|
11月前
|
机器学习/深度学习 人工智能 自然语言处理
Emotion-LLaMA:用 AI 读懂、听懂、看懂情绪,精准捕捉文本、音频和视频中的复杂情绪
Emotion-LLaMA 是一款多模态情绪识别与推理模型,融合音频、视觉和文本输入,通过特定情绪编码器整合信息,广泛应用于人机交互、教育、心理健康等领域。
951 11
Emotion-LLaMA:用 AI 读懂、听懂、看懂情绪,精准捕捉文本、音频和视频中的复杂情绪

热门文章

最新文章