RAG已死,上下文为王?

简介: 本文探讨了“RAG已死,上下文为王”的热议话题,指出RAG与上下文工程本质是概念混淆。上下文工程通过“原子、分子、细胞、器官”层级构建,提升大模型推理效果。文章结合GitHub项目,系统讲解如何科学组织上下文信息,优化LLM应用性能。

最近看到很多的文章都在写“RAG已死,上下文为王”,YB上也非常多的相关的内容。这让我这个刚接触AI应用的初学者感到非常疑惑。在阅读https://github.com/davidkimai/Context-Engineering 后,我对大模型应用有了不一样的理解。

先说结论:RAGContext-Engineering只是概念上的混淆。只是RAG并不能准确描述大模型应用技术,采用上下文工程这个更精确、更高价值的概念来代替。

那么什么是上下文工程?下面一张图就能说明上下文工程。在https://github.com/davidkimai/Context-Engineering中,将上下文工程以生物学隐喻的方式进行展开,图也是基于相关文章进行整理绘制的。

"Context engineering is the delicate art and science of filling the context window with just the right information for the next step." — Andrej Karpathy
"上下文工程是一门精妙的艺术和科学,为下一步填充恰当的信息到上下文窗口中。"

上下文是在推理时提供给 LLM 的完整信息负载,包括模型为合理完成给定任务所需的所有结构化信息组件。废话不多说,先上图:
1000022907.png

原子:提示词的基本单位

完成一个任务所需要的最基本的prompt,由于提供信息过少,模型难保持一致性。
1000022926.jpg

分子:将提示词与示例结合

通过小样本学习的方式做到更高精度和一致性,同时借助外部示例数据库还能实现动态分子(不同任务检索示例数据库提供最相关的示例)。
1000022927.jpg

细胞:添加记忆和状态

默认情况下大模型不具备记忆功能,大模型会忘记先前交互中的信息导致用户体验不连贯

直接将所有历史消息则会导致上下文窗口被填满,因此合理的记忆管理策略十分重要。
1000022928.jpg

器官

上下文器官协调多个LLM细胞来解决任何单个上下文都无法解决的问题。由指挥者、共享记忆、以及专业细胞通过相应的合适所需应用的控制流模式结合组成。

各司其职的器官共同组成一个完整的认知系统。
1000022929.jpg

目前构建器官可能会面临的挑战:

  • 错误可能通过系统传递
  • 编排增加了复杂性和延迟
  • 关键信息可能在细胞之间丢失
  • 复杂的交互难以追踪,调试困难
  • 多次调用LLM增加总token成本
  • 系统设计复杂性高,需要仔细规划和测试

器官构建的最佳实践方式:

  • 从最小化器官开始,根据需要增加复杂性
  • 在隔离状态下测量每个细胞的性能
  • 需要定义细胞之间的清晰输入输出格式
  • 跟踪所有细胞之间的通信
  • 设计细胞处理意外输入
  • 添加专门的细胞来检查输出
  • 先构建基本功能再添加
  • 识别并并行化独立任务

本文参考:https://github.com/davidkimai/Context-Engineering
1000022930.jpg

相关文章
|
6月前
|
传感器 人工智能 边缘计算
智能就在身边:AI如何优化边缘计算
智能就在身边:AI如何优化边缘计算
361 2
|
6月前
|
机器学习/深度学习 人工智能 运维
运维告警别乱飞了!AI智能报警案例解析
运维告警别乱飞了!AI智能报警案例解析
659 0
|
5月前
|
人工智能 定位技术 数据库
工具设计+动态检索:上下文工程如何让AI智能体像人类一样思考?
本文深入解析AI Agent时代的上下文工程,阐述其从提示工程的演进逻辑,剖析系统提示、工具设计与示例策划三大核心,并探讨长时程任务应对策略,揭示高效信息流管理对构建可靠Agent的关键作用。建议收藏细读。
492 0
|
10天前
|
人工智能 自然语言处理 数据可视化
GitHub标星破万!程序员福音,82.5%准确率!这个开源项目重新定义了Text2SQL
DB-GPT 是开源AI原生数据应用框架,GitHub星标破万!支持自然语言查数据库(Text2SQL准确率82.5%)、RAG知识库、生成式BI、多智能体协作等,零代码实现数据对话、分析与可视化,赋能业务人员与开发者。
110 1
|
6月前
|
异构计算
基于MATLAB的NSCT(非下采样轮廓波变换)实现
基于MATLAB的NSCT(非下采样轮廓波变换)实现
183 5
|
7月前
|
人工智能 算法 前端开发
超越Prompt Engineering:揭秘高并发AI系统的上下文工程实践
本文系统解析AI工程范式从Prompt Engineering到Context Engineering的演进路径,深入探讨RAG、向量数据库、上下文压缩等关键技术,并结合LangGraph与智能体系统架构,助力开发者构建高可靠AI应用。
908 2
|
6月前
|
前端开发 安全 Java
基于springboot+vue开发的会议预约管理系统
一个完整的会议预约管理系统,包含前端用户界面、管理后台和后端API服务。 ### 后端 - **框架**: Spring Boot 2.7.18 - **数据库**: MySQL 5.6+ - **ORM**: MyBatis Plus 3.5.3.1 - **安全**: Spring Security + JWT - **Java版本**: Java 11 ### 前端 - **框架**: Vue 3.3.4 - **UI组件**: Element Plus 2.3.8 - **构建工具**: Vite 4.4.5 - **状态管理**: Pinia 2.1.6 - **HTTP客户端
732 4
基于springboot+vue开发的会议预约管理系统
|
6月前
|
新能源
大盘择时:慎用固定均线!12年回测A股数据揭示择时策略的3大适应性缺陷
动量策略加入50日与200日均线择时后收益下降,主要因均线滞后、逻辑冲突及市场变化。解决方案包括动态调整择时参数、结合多指标验证、优化动量执行细节,提升策略适应性与收益表现。
|
6月前
|
机器学习/深度学习 新能源
趋势跟踪 + 大盘择时:牛市收益放大器的终极指南
在量化投资中,大盘择时策略常与其他策略结合使用,以提升收益并控制风险。常见搭配包括趋势跟踪、均值回归、行业轮动、多空对冲、资产配置等。每种策略适用于不同市场状态,如趋势跟踪用于单边行情,均值回归适用于震荡市,行业轮动结合经济周期调整配置方向,多空对冲和资产配置用于风险控制。此外,还可结合机器学习模型提升预测精度,或通过波动率交易优化入场时机。合理搭配可构建多层次投资体系,适应多变市场环境,实现稳健收益。需要注意择时信号的滞后性、策略一致性、模型过拟合风险及交易成本控制。