Agentic Memory 实践:用 agents.md 实现 LLM 持续学习

简介: 利用 agents.md 文件实现LLM持续学习,让AI Agent记住你的编程习惯、偏好和常用信息,避免重复指令,显著提升效率。每次交互后自动归纳经验,减少冷启动成本,跨工具通用,是高效工程师的必备技能。

LLM 能自动化研究、编程等各类任务,但有个恼人的问题:完成一个任务后,下次交互又得从零开始。每次都要重复告诉它代码格式怎么写、任务按什么偏好执行,时间就这么浪费掉了。

agents.md 文件可以让 LLM 把可复用的信息存到单独文件里学习你的习惯和模式。新任务开始时自动读取这个文件,冷启动问题没了重复指令也省了。

本文会概述如何通过持续更新 agents.md 文件来实现 LLM 的持续学习。

为什么需要持续学习?

全新的 Agent 上下文意味着一切从头来过,Agent 要重新摸清你的偏好你得花时间反复调教它。

比如要告诉 Agent 用 Python 3.13 语法别用 3.12,要求函数必须有返回类型,禁止使用 Any 类型等等。用 AI Agent 图的就是快,不需要要反复交代 Python 版本、Any 类型这些事。

Agent 有时还会花时间去查你早就知道的信息:比如文档表叫什么名字、CloudWatch 日志在哪、S3 存储桶的前缀是什么。假如 Agent 不知道文档表的名称,它得先列出所有表,再从中找可能的候选项,最后要么查表确认,要么问你。这套流程下来时间就没了。

这张图片展示了 Agent 查找文档表名称时必须执行的操作。首先必须列出数据库中的所有表,然后找到相关的表名。最后Agent 通过询问用户确认或在表中进行查询来确认它找到了正确的表。这需要花费大量时间。如果可以将文档表的名称存储在 agents.md 中,这样可以在以后编程 Agent 的交互中更加高效。

把文档表名称、CloudWatch 日志、S3 前缀这些信息写进 agents.md,这些时间就全省下来了。所以持续学习的核心诉求很简单:重复指令既烦人又耗时,而我们用 AI Agent 就是要追求极致效率。

如何应用持续学习

最简单的持续学习方法围绕 agents.md 文件展开,建议每个代码仓库都放一个。两个核心做法:

第一,Agent 犯错时告诉它正确做法,并让它把这条经验写进 agents.md。第二每次对话结束后用下面这个 prompt,让 Agent 把对话中学到的东西归纳存档,以后用得上:

 Generalize the knowledge from this thread, and remember it for later.   
 Anything that could be useful to know for a later interaction,   
 when doing similar things. Store in agents.md

这两招能让你在持续学习这件事上完成 80% 的工作,工程效率会有明显提升。

关键在于时刻惦记着 Agentic Memory。Agent 做了不对的事?立刻存到 agents.md 里。

你可能担心 agents.md 越写越长会拖慢 Agent、增加成本。其实不会,因为LLM 很擅长压缩归纳信息,几千字的 agents.md 根本不算什么。前沿 LLM 的上下文窗口动辄几十万 Token,完全装得下。

所以成本方面可能反而会下降,因为Agent 不用再花 Token 去查那些已经写在 agents.md 里的信息了。

重度使用 agents.md 进行 Agentic Memory 会让 LLM 用得更快,成本更低

一些实用技巧

Claude Code 里有个便捷操作:在终端输入 # 加内容就能直接写入 Agent 记忆。比如:

 # Always use Python 3.13 syntax, avoid 3.12 syntax

输入后会弹出选项让你选择存储位置。保存到用户记忆,信息会跨所有仓库生效,适合通用规则(比如函数必须有返回类型)。保存到当前文件夹,适合特定服务的配置。保存到项目根目录整个仓库都能读到。

这张图片突出显示了在 Claude 中拥有的不同记忆选项。可以选择保存到用户记忆中将记忆存储在你的所有会话中,无论是哪个仓库。此外还可以将其存储在你所在项目的子文件夹中,例如存储关于特定服务的信息。最后还可以将记忆存储在项目根文件夹中,这样与该仓库的所有工作都将拥有该上下文。

不同编程 Agent 用的记忆文件不一样:Claude Code 用 CLAUDE.md,Warp 用 WARP.md,Cursor 用 .cursorrules。

但 agents.md 基本上所有 Agent 都认的文件名,所以我建议把信息往 agents.md 里写,这样不管用哪个编程 Agent 都能读到。毕竟今天 Claude Code 最强,明天说不定换别家了。

AGI 与持续学习

真正的持续学习有时被认为是 AGI 的最后几道门槛之一。现在的 LLM 本质上是用文件(比如 agents.md)来模拟持续学习——把学到的东西存下来,下次读取。理想状态应该是模型在学习新信息时直接更新权重,就像人的本能那样。

真正的持续学习还没实现,但这应该是未来几年会有突破的方向。

总结

想成为更高效的工程师,用好 agents.md 做持续学习是一条捷径。Agent 会逐渐学会你的习惯、记住你常犯的错误、熟悉你常用的信息,后续交互越来越顺畅。我认为重度使用 agents.md 是成为优秀工程师的必备技能,值得持续投入。

https://avoid.overfit.cn/post/7e3796a1a0214e1984037d8deee4a44f

作者:Eivind Kjosbakken

目录
相关文章
|
29天前
|
人工智能 自然语言处理 运维
阿里开源 Assistant Agent,助力企业快速构建答疑、诊断智能助手
一款快速构建智能客服、诊断助手、运维助手、AIOps 的开源框架。
688 58
|
1月前
|
弹性计算 网络安全 异构计算
使用阿里云GPU服务器部署Qwen3-235B-A22B推理模型,基于ecs.ebmgn8v实例规格
本文介绍如何使用阿里云GPU服务器(ecs.ebmgn8v实例,8卡96GB显存)部署Qwen3-235B-A22B大模型,涵盖创建VPC、安全组、GPU实例、环境配置、模型下载、部署及推理测试全流程,费用约290元/小时。
|
1月前
|
人工智能 Linux 异构计算
使用阿里云GPU服务器部署DeepSeek-R1模型图文教程,2026年最新新手AI大模型部署流程
本文介绍2026年最新阿里云GPU服务器部署DeepSeek-R1大模型的全流程,包含创建GPU实例、部署模型及启动Open WebUI三步。涵盖实例配置选择、Docker环境搭建、模型下载与推理服务启动,适合新手快速上手AI大模型部署。
|
2月前
|
人工智能 运维 自然语言处理
2025年开源AI知识库深度体验:PandaWiki重新定义企业知识管理
2025年末了,作为一名AI的资深使用者我对PandaWiki有一点使用体会想分享下,写的不好请见谅。
|
1月前
|
数据采集 人工智能 自然语言处理
一文读懂LLM微调:新手必知的原理、误区与场景化应用方案
本文深入浅出讲解LLM微调原理与实操,涵盖新手必知的核心概念、常见误区及场景化应用方案。通过类比“学霸特训”,解析微调与提示词区别,推荐轻量级LoRA方法,提供从数据准备、环境搭建到模型训练、效果评估的完整步骤,并附实用工具与避坑指南,助力AI初学者快速掌握定制化模型技能,实现个人或企业级AI应用落地。
|
1月前
|
运维 安全 Linux
Xshell-7.0.0164.exe 使用步骤详解(附连接与常见问题)
Xshell 7是一款功能强大的SSH客户端,用于远程连接Linux服务器、虚拟机或网络设备。通过简单安装与配置,用户可快速建立安全会话。支持密码和密钥登录,具备多标签、复制粘贴、文件传输(配合Xftp)和操作日志记录等实用功能,是运维管理的高效工具。
|
22天前
|
存储 缓存 监控
pandas 3.0 内存调试指南:学会区分真假内存泄漏
本文揭秘pandas“内存不释放”的常见误解:非泄漏,实为CoW共享、Arrow缓冲池、视图隐式引用及分配器延迟归还OS内存所致。RSS≠真实占用,排查需结合tracemalloc、objgraph与原生指标,核心是管控引用生命周期。
161 12
pandas 3.0 内存调试指南:学会区分真假内存泄漏
|
1月前
|
人工智能 安全 API
Nacos 安全护栏:MCP、Agent、配置全维防护,重塑 AI Registry 安全边界
Nacos安全新标杆:精细鉴权、无感灰度、全量审计!
927 70
|
6天前
|
人工智能 测试技术
LLM创造力可以被度量吗?一个基于提示词变更的探索性实验
本文探讨提示词工程为何仍是“玄学”,并通过实验证明:加入明确指令(如“Be as creative as possible”)可显著、可量化地提升LLM输出多样性,效果甚至超过调高温度。研究以embedding距离为代理指标,覆盖13个主流模型,揭示提示词迭代可度量、可预测,为LLM应用从经验走向工程化提供新路径。
79 17
LLM创造力可以被度量吗?一个基于提示词变更的探索性实验
|
9天前
|
人工智能 自然语言处理 API
2026年OpenClaw(Clawdbot)部署WordPress网站教程:零基础也能快速搞定
OpenClaw作为开源AI助手平台,最强大的优势在于能通过自然语言对话完成复杂的服务器部署操作,彻底打破技术门槛。本文将详细介绍如何借助OpenClaw在阿里云轻量应用服务器上搭建WordPress网站,全程无需专业开发知识,仅需会使用聊天工具就能完成,从服务器配置到网站上线、内容发布全流程覆盖,同时包含实用命令与避坑指南,确保新手也能一次成功。
177 21

热门文章

最新文章