📚 RAG技术

简介: RAG(检索增强生成)通过结合外部知识库与大模型,提升回答准确性,缓解幻觉与知识过时问题。涵盖基础流程、核心组件、密集与混合检索技术,并对比FAISS、Pinecone等向量数据库。附实战代码与面试高频问题解析,助力系统构建与优化。

🎯 概述

RAG (Retrieval-Augmented Generation) 通过检索外部知识增强大模型能力,解决知识时效性和幻觉问题。

🏗️ RAG架构

1️⃣ 基础RAG流程

graph TD

   A[用户查询] --> B[检索器]

   B --> C[知识库]

   C --> D[相关文档]

   D --> E[生成器]

   E --> F[增强回答]

2️⃣ 核心组件

  • 检索器:Dense Passage Retrieval、ColBERT
  • 生成器:大语言模型
  • 知识库:向量数据库、文档存储

🏗️ 检索技术

1️⃣ 密集检索

  • DPR:双编码器架构
  • Contriever:无监督预训练
  • ColBERT:延迟交互模型

2️⃣ 混合检索

  • 稠密+稀疏:结合向量检索和关键词检索
  • 重排序:交叉编码器精排
  • 多路召回:提高召回率

📊 向量数据库对比

数据库

特点

性能

适用场景

FAISS

高效相似度搜索

研究原型

Pinecone

托管服务

生产环境

Weaviate

图数据库

复杂关系

Milvus

分布式

大规模数据

🎯 实战代码

from langchain.vectorstores import FAISS
from langchain.embeddings import HuggingFaceEmbeddings
from langchain.text_splitter import RecursiveCharacterTextSplitter
# 初始化组件
embeddings = HuggingFaceEmbeddings(model_name="sentence-transformers/all-MiniLM-L6-v2")
text_splitter = RecursiveCharacterTextSplitter(chunk_size=1000, chunk_overlap=200)
# 构建知识库
documents = text_splitter.split_documents(raw_documents)
vectorstore = FAISS.from_documents(documents, embeddings)
# 检索增强
retriever = vectorstore.as_retriever(search_kwargs={"k": 3})
qa_chain = RetrievalQA.from_chain_type(
    llm=llm,
    chain_type="stuff",
    retriever=retriever
)

🎯 面试重点

  1. RAG如何解决幻觉问题?
  2. 稠密检索vs稀疏检索的区别?
  3. 如何评估RAG系统的效果?
  4. RAG的局限性和改进方向?
目录
相关文章
|
运维 SpringCloudAlibaba Kubernetes
云原生-我的学习路线总结
我的学习路线总结
3048 0
|
3月前
|
人工智能 容灾 iOS开发
开源了自己优化升级的openclaw:38 个技能 + 五级容灾 + 飞书深度集成
xyvaClaw 是开源的增强型AI助手平台,基于OpenClaw构建,集成38+实战技能、五级模型容灾、无损上下文引擎与四层记忆系统;深度适配飞书(112个TS文件),支持一键部署、本地私有化及自我进化,真正实现企业级智能办公自动化。
|
4月前
|
人工智能 物联网 Shell
告别“人工智障”:零代码驯服大语言模型,打造你的专属AI助手
本文详解大模型微调(Fine-tuning)如何破解通用AI“懂但不专”的痛点:用专属数据为大模型做“岗前培训”。全程零代码、纯在线,基于ModelScope与QLoRA技术,30分钟即可完成Yi-6B模型微调,重塑其身份认知。兼顾原理通俗解读与手把手实战,助你真正掌握“塑造AI”的主动权。(239字)
429 3
告别“人工智障”:零代码驯服大语言模型,打造你的专属AI助手
|
6月前
|
存储 人工智能 NoSQL
RAG技术
RAG(检索增强生成)通过结合外部知识库与大模型,提升回答准确性,缓解知识过时与幻觉问题。核心架构含检索器、生成器与向量数据库,支持密集、混合检索,常用FAISS、Pinecone等工具,广泛应用于问答系统与AI面试场景。(238字)
219 0
|
3月前
|
人工智能 监控 数据可视化
2026年的企业级 AI 应用:工作流的边界,与 Coding 的回归
2026年,企业级AI应用进入新分水岭:工作流解决启动快,代码承载长期复杂性。Dify、n8n等平台正补工程能力,LangGraph等框架则增强编排性。核心命题已非“二选一”,而是——**Workflow管编排,Code管核心**:低风险场景用可视化,高可靠需求回归代码优先。(239字)
809 6
|
5月前
|
人工智能 程序员 API
2026 AI 元年:从“单兵作战”到“智能体集群”,程序员的生存与重构
2026 年是真正的“AI Agent 元年”。大模型已从单一的文本生成进化为具备自主执行能力的“智能体集群”。本文将深度解析中国 AI 产业在这一进程中的技术贡献,探讨开发者如何从底层代码编写者转型为智能体编排专家,并揭示未来三年的行业重构路径。
587 1
|
5月前
|
人工智能 自然语言处理 搜索推荐
AI 应用的开发方法
2026年AI开发已迈入智能体与规格驱动的新范式:AI不再是功能,而是应用底层逻辑。开发者从写代码转向定义规格(Spec),由AI自动生成系统设计与代码;通过代理式工作流实现多步协作、记忆共生与工具调用;结合RAG 2.0、大小模型协同及无感基础设施,构建真正个性化的AI原生应用。#AI应用 #AI大模型
|
5月前
|
数据采集 人工智能 安全
2026AI元年:AI 落地范式转移:已被反复验证的产业级实践共识
本文探讨AI从技术竞赛迈向产业落地的关键转型:2026年成规模化应用分水岭。强调落地核心不在模型参数,而在数据治理、工作流重构、RAG工程化、推理可控性、人类协同机制及四大落地准则——场景对齐、知识解耦、架构弹性、迭代闭环。
466 0
|
人工智能 数据可视化 API
AI Agents Loop异步执行可视化Tutorial 借助AgentBoard工具可视化工作流
本文介绍了AI Agent的异步执行循环(Agent Loop),并展示了如何利用开源框架agentboard可视化这一过程。通过分析不同框架(如AutoGen、LangGraph、AutoAgent)对Agent Loop的抽象,文章详细说明了从简单的功能调用到复杂的多阶段执行流程的设计。此外,还提供了使用agentboard进行日志记录与流程可视化的具体示例,包括安装步骤、代码实现及运行方法,帮助开发者更高效地调试和优化AI Agent的应用。
AI Agents Loop异步执行可视化Tutorial 借助AgentBoard工具可视化工作流
|
数据采集 算法 物联网
【算法精讲系列】阿里云百炼SFT微调实践分享
本内容为您提供了百炼平台SFT微调的实践案例,帮助您方便并快速借助模型微调定制化您自己的专属模型。
4472 14