07|Agent 记忆系统:短期上下文、长期规则和项目知识

简介: 编程Agent的记忆并非“永久记住所有内容”,而是科学的上下文工程。本文厘清三类记忆:短期上下文(任务现场)、长期规则(团队约定)和项目知识(按需检索),强调分类管理、避免污染,并给出落地实践与判断标准,助你构建清晰、可维护的Agent记忆体系。(239字)

ScreenShot_2026-06-02_212013_590.png

编程 Agent 的记忆问题,很容易被误解。

很多人以为“记忆”就是让模型永远记住所有对话。真实情况不是这样。模型本身不会自动带着你上周的项目细节进入今天的任务。Harness 必须把需要保留的信息,以某种形式重新加载进上下文。

所以,Agent 记忆不是玄学,而是上下文工程。

三类记忆

在工程实践里,可以把 Agent 记忆分成三类。

第一类是短期上下文。它存在于当前会话里,包括用户任务、对话历史、文件内容、工具输出、测试结果。会话结束后,它通常不会自动进入下一次任务。

第二类是长期规则。比如 CLAUDE.md、AGENTS.md、Cursor Rules。这些文件记录项目约定、构建命令、代码风格、架构边界,每次会话开始时加载。

第三类是项目知识。比如代码图谱、文档索引、历史故障记录、接口说明、设计决策。这类知识通常不应该全部塞进上下文,而应该按需检索。

image.png

这三类记忆不能混用。把所有项目知识都塞进长期规则,会让上下文变脏;把关键团队规范只放在对话里,下次就会丢。

短期上下文:任务现场

短期上下文是 Agent 当前正在处理的现场。

比如你让它修一个 bug,它会逐步收集:

  • 报错信息;
  • 相关文件;
  • 测试输出;
  • Git diff;
  • 用户补充说明;
  • 中间计划。

短期上下文适合放当前任务相关的信息,不适合承载长期规范。

一个常见问题是长任务做着做着上下文满了。Harness 会压缩或摘要旧内容,但摘要一定会丢细节。重要规则如果只在对话开头说过,后面可能不再可靠。

解决方法是:长期规则写进规则文件,任务关键点阶段性复述,复杂任务拆小。

长期规则:团队约定

长期规则的价值,是减少重复解释。

比如:

本项目后端使用 Java 21 和 Spring Boot。
数据库迁移脚本放在 sql/migration。
所有接口错误返回 ApiError。
提交前必须运行 mvn test。
不要修改 generated 目录。

这些信息每次任务都可能有用,适合写进 CLAUDE.md、AGENTS.md 或 .cursor/rules

但长期规则要克制。Claude Code 官方文档也提醒,CLAUDE.md 内容越具体、越简洁,越容易被遵守;太大、冲突或模糊都会降低效果。

一个经验是:项目级规则控制在 100-200 行以内。超过这个长度,就应该拆成路径规则或 Skills。

项目知识:按需召回

项目知识往往很大。

比如:

  • 全部 API 文档;
  • 历史 PR;
  • 事故复盘;
  • 代码调用图;
  • 数据库表结构;
  • 产品需求;
  • 设计稿说明。

这些信息不能每次都加载。正确方式是索引起来,任务需要时按需召回。

这就是 CodeGraph、Understand-Anything、RAG、MCP 文档服务的价值。它们不只是“存资料”,而是帮助 Agent 在合适时间找到相关知识。

记忆污染

记忆不是越多越好。

记忆污染常见于三种情况。

第一,旧规则没删。项目已经从 npm 切到 pnpm,但规则里还写 npm。

第二,个人偏好混进团队规则。某个开发者喜欢某种写法,不代表团队都应该遵守。

第三,临时结论变成长期事实。一次排障时的猜测被写进记忆,下次 Agent 当成真相。

所以记忆需要维护。规则文件要像代码一样 Review,过期内容要删,冲突规则要合并。

真实落地方式

一个团队可以这样组织记忆:

AGENTS.md
  通用 Agent 指令,供多种工具读取

CLAUDE.md
  Claude Code 专用补充

.cursor/rules/
  Cursor 路径级规则

docs/architecture.md
  架构说明,按需引用

.codegraph/
  代码索引,本地生成

规则里只写长期稳定的事。复杂流程放 Skills。大量知识放索引系统。临时任务信息留在会话里。

什么时候该写入记忆

可以用四个判断标准。

第一,Agent 第二次犯同样错误。

第二,Code Review 提醒了某个项目规则。

第三,新人也需要知道这条信息。

第四,这条信息未来多个任务都会用到。

如果只对当前任务有用,不要写进长期规则。

总结

Agent 记忆的核心不是“让模型什么都记住”,而是把信息放到正确位置。

当前任务信息:放短期上下文
团队稳定约定:放长期规则
大量项目资料:放知识索引
必须强制执行:放权限和 hooks

记忆系统做得好,Agent 会越来越懂项目;做得差,它只会越来越混乱。

目录
相关文章
|
18天前
|
人工智能 自然语言处理 文字识别
阿里云百炼Qwen3.7-Max简介:能力、优势、支持订阅计划参考
Qwen3.7-Max是阿里云百炼面向智能体时代推出的新一代旗舰模型,对标GPT-5.5、Claude Opus 4.7等闭源旗舰。该模型支持百万级token上下文窗口,具备顶级推理能力、多模态搜索与视觉理解增强、流式输出低延迟响应等核心优势,覆盖编程、办公、长周期自主执行等复杂场景。同时支持OpenAI接口兼容,便于系统快速迁移。用户可通过Token Plan团队或节省计划等订阅方式灵活调用,适合企业级高要求场景使用。
6837 30
阿里云百炼Qwen3.7-Max简介:能力、优势、支持订阅计划参考
|
3天前
|
数据采集 人工智能 前端开发
让 Coding Agent 从黑盒到透明:阿里云 Agent 观测审计数据采集实践
AI Agent 规模化落地带来执行黑盒、行为难追溯、成本难度量三大难题。阿里云基于 OTel 标准,面向 Coding Agent、个人通用助理和框架型 Agent,推出 LoongSuite Pilot、插件及探针等无侵入采集方案,让 Agent 实现可看见、可分析、可审计、可治理。
605 138
|
3天前
|
人工智能 弹性计算 运维
阿里云发布堡垒机智能运维Agent,运维交互进入自然语言新时代
支持自然语言运维,提升效率与安全双保障。
1145 0
|
10天前
|
人工智能 安全 定位技术
CodeGraph深度解析 让Claude Code工具调用直降七成的核心原理与实操教程
如今以Claude Code为代表的AI编程智能体已经成为开发者日常编码、项目重构、漏洞修复的必备工具。但在长期使用过程中,几乎所有开发者都会遇到同一个明显痛点:AI虽然具备强大的代码生成与分析能力,却常常陷入盲目探索的循环中。
1173 1
|
13天前
|
存储 定位技术 数据库
CodeGraph 如何让 Claude Code减少 7 成工具调用?
CodeGraph 为 Coding Agent 提供本地代码知识图谱,把函数、类、调用链和框架路由提前整理成“项目地图”,减少盲目搜索和文件读取。它不是新 Agent,而是上下文基础设施,让 Agent 更快找到正确代码路径,平均减少 7 成工具调用。
1273 3
|
11天前
|
人工智能 弹性计算 安全
阿里云618活动时间、活动入口、优惠活动详细解读
2026年阿里云618创新加速季已全面开启,作为年度力度最大的云产品促销活动,本次大促覆盖轻量应用服务器、ECS云服务器、GPU云服务器、数据库、AI算力、安全服务、CDN等全品类产品,推出5亿元算力补贴、新用户限时秒杀、普惠满减、企业专享、免费试用、云大使返佣等多重福利,个人开发者、中小企业、AI团队均可享受专属低价。本文将系统梳理2026年阿里云618活动的完整时间节点、官方参与入口、各类优惠细则、使用规则、热门产品推荐及实操代码,帮助用户精准参与、高效省钱,以最低成本完成上云部署。
982 5
|
9天前
|
人工智能 自然语言处理 安全
Vibe Coding 实战:别盲目跟风,先分清 vibe coding 适合什么场景
本文系统总结vibe coding实战经验:明确其适用场景(原型、小工具、标准化模块),剖析5步落地流程(场景判定→结构化提示词→目录初始化→分模块生成→自动化校验),指出四大常见误区,并推荐适配工具Trae。强调“场景匹配+规则前置”是提效关键,避免盲目套用。
806 1