RAG已死,上下文为王?

简介: 本文探讨了“RAG已死,上下文为王”的热议话题,指出RAG与上下文工程本质是概念混淆。上下文工程通过“原子、分子、细胞、器官”层级构建,提升大模型推理效果。文章结合GitHub项目,系统讲解如何科学组织上下文信息,优化LLM应用性能。

最近看到很多的文章都在写“RAG已死,上下文为王”,YB上也非常多的相关的内容。这让我这个刚接触AI应用的初学者感到非常疑惑。在阅读https://github.com/davidkimai/Context-Engineering 后,我对大模型应用有了不一样的理解。

先说结论:RAGContext-Engineering只是概念上的混淆。只是RAG并不能准确描述大模型应用技术,采用上下文工程这个更精确、更高价值的概念来代替。

那么什么是上下文工程?下面一张图就能说明上下文工程。在https://github.com/davidkimai/Context-Engineering中,将上下文工程以生物学隐喻的方式进行展开,图也是基于相关文章进行整理绘制的。

"Context engineering is the delicate art and science of filling the context window with just the right information for the next step." — Andrej Karpathy
"上下文工程是一门精妙的艺术和科学,为下一步填充恰当的信息到上下文窗口中。"

上下文是在推理时提供给 LLM 的完整信息负载,包括模型为合理完成给定任务所需的所有结构化信息组件。废话不多说,先上图:
1000022907.png

原子:提示词的基本单位

完成一个任务所需要的最基本的prompt,由于提供信息过少,模型难保持一致性。
1000022926.jpg

分子:将提示词与示例结合

通过小样本学习的方式做到更高精度和一致性,同时借助外部示例数据库还能实现动态分子(不同任务检索示例数据库提供最相关的示例)。
1000022927.jpg

细胞:添加记忆和状态

默认情况下大模型不具备记忆功能,大模型会忘记先前交互中的信息导致用户体验不连贯

直接将所有历史消息则会导致上下文窗口被填满,因此合理的记忆管理策略十分重要。
1000022928.jpg

器官

上下文器官协调多个LLM细胞来解决任何单个上下文都无法解决的问题。由指挥者、共享记忆、以及专业细胞通过相应的合适所需应用的控制流模式结合组成。

各司其职的器官共同组成一个完整的认知系统。
1000022929.jpg

目前构建器官可能会面临的挑战:

  • 错误可能通过系统传递
  • 编排增加了复杂性和延迟
  • 关键信息可能在细胞之间丢失
  • 复杂的交互难以追踪,调试困难
  • 多次调用LLM增加总token成本
  • 系统设计复杂性高,需要仔细规划和测试

器官构建的最佳实践方式:

  • 从最小化器官开始,根据需要增加复杂性
  • 在隔离状态下测量每个细胞的性能
  • 需要定义细胞之间的清晰输入输出格式
  • 跟踪所有细胞之间的通信
  • 设计细胞处理意外输入
  • 添加专门的细胞来检查输出
  • 先构建基本功能再添加
  • 识别并并行化独立任务

本文参考:https://github.com/davidkimai/Context-Engineering
1000022930.jpg

相关文章
|
2月前
|
传感器 人工智能 边缘计算
智能就在身边:AI如何优化边缘计算
智能就在身边:AI如何优化边缘计算
245 2
|
2月前
|
机器学习/深度学习 人工智能 运维
运维告警别乱飞了!AI智能报警案例解析
运维告警别乱飞了!AI智能报警案例解析
403 0
|
2月前
|
人工智能 数据可视化 数据处理
从拖拽到架构:低代码如何兼顾速度、灵活性与可控边界
在敏捷开发背景下,低代码技术已从工具层面演进为架构级交付要素,重构IT治理与系统边界管理。它推动开发职能在专业开发者、业务人员与运维管理者之间重新分配,带来灵活性的同时也引发架构平衡、系统可维护性与治理统一等挑战。唯有在清晰架构与治理规则下,低代码才能真正成为敏捷开发的助推器,而非技术债务来源。本文深入探讨低代码在可视化工作流、模型驱动开发、数据处理、AI融合、插件生态、开放架构与企业功能等方面的技术实现与业务价值。
从拖拽到架构:低代码如何兼顾速度、灵活性与可控边界
|
1月前
|
人工智能 定位技术 数据库
工具设计+动态检索:上下文工程如何让AI智能体像人类一样思考?
本文深入解析AI Agent时代的上下文工程,阐述其从提示工程的演进逻辑,剖析系统提示、工具设计与示例策划三大核心,并探讨长时程任务应对策略,揭示高效信息流管理对构建可靠Agent的关键作用。建议收藏细读。
323 0
|
2月前
|
机器学习/深度学习 存储 运维
数据别乱跑!聊聊智能运维如何减少数据丢失风险
数据别乱跑!聊聊智能运维如何减少数据丢失风险
112 4
|
2月前
|
人工智能 云计算
和五所高校一起,我们共同打造了一门AI课程!丨云工开物
9月1日,阿里云联合多所高校推出的「动手学AI:人工智能通识与实践」课程正式开放。课程涵盖理论与实践,支持多专业定制,助力高校AI人才培养。
|
2月前
|
前端开发 安全 Java
基于springboot+vue开发的会议预约管理系统
一个完整的会议预约管理系统,包含前端用户界面、管理后台和后端API服务。 ### 后端 - **框架**: Spring Boot 2.7.18 - **数据库**: MySQL 5.6+ - **ORM**: MyBatis Plus 3.5.3.1 - **安全**: Spring Security + JWT - **Java版本**: Java 11 ### 前端 - **框架**: Vue 3.3.4 - **UI组件**: Element Plus 2.3.8 - **构建工具**: Vite 4.4.5 - **状态管理**: Pinia 2.1.6 - **HTTP客户端
353 4
基于springboot+vue开发的会议预约管理系统
|
2月前
|
存储 机器学习/深度学习 数据库
用于最近邻搜索的乘积量化——论文阅读
本文介绍了用于最近邻搜索的乘积量化方法,通过将高维向量划分为低维子空间并分别量化,实现高效近似欧氏距离计算。该方法结合非对称距离计算(ADC)与倒排文件系统(IVFADC),在保持高搜索精度的同时显著降低计算复杂度和内存占用。实验表明,乘积量化在SIFT和GIST描述符上的表现优于现有方法,适用于大规模图像检索等应用。
55 1
用于最近邻搜索的乘积量化——论文阅读
|
2月前
|
新能源
大盘择时:慎用固定均线!12年回测A股数据揭示择时策略的3大适应性缺陷
动量策略加入50日与200日均线择时后收益下降,主要因均线滞后、逻辑冲突及市场变化。解决方案包括动态调整择时参数、结合多指标验证、优化动量执行细节,提升策略适应性与收益表现。