给 AI Agent 加记忆之前,先决定它到底允许记住什么

简介: 给 AI Agent 接入记忆层之前,先区分短期上下文、长期事实和推理轨迹,并用最小 dry run 验证写入、检索、纠错和删除边界。

给 AI Agent 加记忆之前,先决定它到底允许记住什么

Agent memory 是一个很容易被讲空的能力。

最简单的说法是:把对话存起来,下次检索相似内容,再塞回上下文。

但真正接到 AI 宿主里时,问题会立刻变具体:

  • 哪些内容只是当前会话上下文?
  • 哪些内容算长期事实、偏好或关系?
  • 哪些内容是 reasoning trace,而不是用户知识?
  • 记忆归属于用户、项目、工作区,还是全局?
  • 错误记忆如何纠正?
  • 删除路径在哪里?
  • Agent 下次使用某条记忆时,如何证明来源?

这也是我阅读 Doramagic 的 agent-memory manual 时认为最重要的点:它不应该被理解成“给 Agent 接一个向量库”,而应该被理解成“给 Agent 建立可审计的记忆边界”。

项目地址:

第一层理解:三类记忆不是一回事

Doramagic manual 把 agent-memory 的核心拆成三层:

层级 存什么 为什么重要
short-term memory 当前 session / conversation 的消息历史 帮 Agent 保持当前对话上下文,但不把一切都变成永久知识
long-term memory entity、preference、relationship 用于长期事实、用户偏好、领域关系,但也带来隐私、纠错和租户隔离问题
reasoning memory step、tool call、trace、similar trace 让 Agent 行为可复盘,而不是把“它为什么这么做”藏在黑箱里

这个拆分很关键。

“记住所有东西”不是工程方案,而是一个数据治理风险。

用户的一句话可能只适合留在 short-term memory。

一个明确确认过的偏好,才可能进入 long-term memory。

一次失败的工具调用和恢复过程,更适合进入 reasoning memory,而不是混进用户事实库里。

如果 AI 宿主不知道自己正在读写哪一层记忆,就不应该直接上生产。

Neo4j 图结构不是装饰

agent-memory 使用 Neo4j 作为图存储后端。这个选择并不是为了“看起来更高级”,而是因为 Agent memory 经常不是一堆文本块。

真实记忆往往有关系:

  • 某个人属于某个组织
  • 某个任务来自某次 session
  • 某次 tool call 影响了某个 entity
  • 某个 preference 只属于一个用户
  • 某条 reasoning trace 创建或更新了某个记录

manual 中提到 POLE+O 类型:PERSONORGANIZATIONLOCATIONEVENTOBJECT,并支持扩展实体类型。

这意味着长期记忆不是随便扔进一个 note,而是进入一个可描述、可检查、可演进的结构。

当然,图结构不会自动让系统正确。

它只是让错误更容易被看见。

这已经很重要。

后端选择就是边界选择

manual 提到两条后端路径:

  • 通过 Bolt 直连 Neo4j
  • 通过 hosted NAMS REST backend

这不是一个小小的部署选项,而是运行边界。

如果你走自托管 Neo4j,就要负责数据库配置、隔离、备份、权限和运维。

如果你走 NAMS,就要检查远程服务边界、workspace 所属、API 配置、本体版本等问题。

所以第一次评估时,不要先问“哪个更先进”。

应该先问:

这份记忆允许存在哪里?以后谁能读到它?

这个问题回答不清楚,就不要让 Agent 写入长期记忆。

Ontology 是容易被低估的部分

manual 中还提到 NAMS 的 typed、versioned ontology layer。

这部分很容易被忽略,但它决定了记忆能否长期维护。

没有 ontology 边界时,Agent memory 会悄悄漂移:

  • 同一个实体被记成多个名字
  • preference 和 fact 混在一起
  • tool result 被误当成用户意图
  • 过期知识继续被检索
  • 私有记忆和共享记忆混在同一个池子

ontology 不能自动解决这些问题,但它提供了一个地方来定义“什么是有效记忆”。

第一次试用时,我不建议直接设计复杂领域模型。

更合理的首跑是:

  • 一个测试用户
  • 一个测试 session
  • 两种 entity type
  • 一种 relationship
  • 一条 reasoning trace
  • 一个纠错案例

如果这样的小闭环都无法检查和纠正,扩大规模只会让问题更难发现。

一个安全的第一次运行

给 AI 宿主接入 agent-memory 之前,可以先做一个 sandbox dry run。

不要用生产凭据,不要用真实用户数据。

推荐的最小验证路径:

  1. 创建临时测试用户和 session。
  2. 写入一条 short-term conversation message。
  3. 写入一个明确的 long-term entity,例如一个假的用户偏好。
  4. 记录一次 reasoning step 或 tool call。
  5. 在下一轮检索上下文。
  6. 检查返回内容分别来自哪一层 memory。
  7. 修改或删除一条错误记忆。
  8. 再次检索,确认纠正生效。

这里最重要的产物不是“demo 跑起来了”。

真正重要的产物是审计链:

  • 写入了什么
  • 为什么写入
  • 存在哪里
  • 如何被检索
  • 如何被纠正
  • 哪些东西 Agent 不允许记住

最大的坑:把 memory 当成开关

“给 Agent 加 memory”听起来像一个功能增强。

实际上,它改变的是 Agent 的状态模型。

无状态 Agent 可能在一次运行里犯错。

有状态 Agent 可能犯错、记住错误,然后在下一次运行里更自信地复用这个错误。

所以 memory 不是不能加。

而是必须从更小的首跑、更清楚的权限、更可见的复核路径开始。

接入前检查表

在让 AI 宿主使用记忆层之前,至少回答这些问题:

  • 启用了哪些 memory tier?
  • 哪些写入是自动的,哪些写入需要确认?
  • 后端存储在哪里?
  • 记忆按用户、workspace、tenant 还是项目隔离?
  • 用户能否查看和纠正被记住的事实?
  • reasoning trace 是否和长期用户知识分开?
  • 检索结果是否显示 provenance?
  • 删除路径是否明确?
  • 是否有一个 sandbox test 能证明这些边界?

如果答案不清楚,下一步不是生产接入。

下一步应该是更小的验证闭环。

参考:Doramagic agent-memory manual:https://doramagic.ai/en/projects/agent-memory/manual/

说明:本文基于 Doramagic 对 neo4j-labs/agent-memory 的独立项目整理,不是 Neo4j 官方文档,也不代表上游项目背书。

相关文章
|
10天前
|
缓存 测试技术 API
Qwen 3.7 Plus 与 Max 实测:性价比与多模态能力差异解析(2026)
2026 年 6 月 1 日,阿里悄无声息地发布了 Qwen 3.7 Plus,距 Qwen 3.7 Max 上线刚好 11 天。同样的 1M 上下文,同样的 35 小时自治上限。但价格才是头条:Plus 是 0.40/M输入,Max是 2.50/M——便宜约 6 倍——并且还能看图、看视频。Vision Arena 上 Plus 已经排到 #16。所以这周真正值得讨论的问题不是”要不要为视觉能力买单”,而是”Max 凭什么用 6 倍价格换来 2 个百分点的 benchmark 领先”。
|
10天前
|
JavaScript 定位技术 API
CodeGraph 爆火:编程 Agent 需要的不是更多上下文,而是一张提前画好的代码地图
CodeGraph 是一款爆火的本地代码智能工具,通过 tree-sitter 解析 AST 构建结构化知识图谱(存于 SQLite),为编程 Agent 提前生成“代码地图”。它显著降低 Agent 在中大型项目中的探索成本——实测工具调用减少71%、Token 降57%、速度提升46%,支持19+语言及主流框架路由识别,完全离线、无需 API Key。
792 11
CodeGraph 爆火:编程 Agent 需要的不是更多上下文,而是一张提前画好的代码地图
|
10天前
|
人工智能 运维 JavaScript
阿里云Qoder CN(原通义灵码)全解析 产品形态、版本划分与技术适配说明
在AI辅助开发与智能办公工具持续普及的当下,阿里云旗下原通义灵码正式更名为Qoder CN,同时延伸出QoderWork CN、Qoder CN CLI、Qoder CN Mobile等多款配套产品,形成覆盖代码开发、日常办公、终端交互、移动端使用的完整工具矩阵。Qoder CN核心定位为AI智能编码助手,深度适配主流代码编辑器、集成开发环境以及终端场景;QoderWork CN则偏向桌面端综合办公辅助,二者面向不同使用场景,划分了多个版本档位,搭配差异化资源配额、功能权限与计费规则,同时兼容多款主流大模型。
815 7
|
10天前
|
存储 安全 Java
AgentScope Java 2.0:打造分布式、企业级智能体底座
AgentScope 2.0 面向分布式部署、稳定运行、权限安全等企业级需求全面升级,打造支持多租户隔离与长期稳定运行的企业级智能体底座。
|
10天前
|
JSON 缓存 安全
通过 CC Switch 本地路由让 Codex CLI 接入 DeepSeek 等第三方模型
CC Switch 通过本地路由(`127.0.0.1:15721`)实现协议转换:将 Codex 的 Responses API 请求自动映射为 DeepSeek 等厂商的 Chat Completions 接口,兼容流式响应与工具调用,无需修改 Codex 源码,安全隔离 API Key。(239字)
2188 4
通过 CC Switch 本地路由让 Codex CLI 接入 DeepSeek 等第三方模型
|
10天前
|
人工智能 弹性计算 安全
阿里云618活动时间、活动入口、优惠活动详细解读
2026年阿里云618创新加速季已全面开启,作为年度力度最大的云产品促销活动,本次大促覆盖轻量应用服务器、ECS云服务器、GPU云服务器、数据库、AI算力、安全服务、CDN等全品类产品,推出5亿元算力补贴、新用户限时秒杀、普惠满减、企业专享、免费试用、云大使返佣等多重福利,个人开发者、中小企业、AI团队均可享受专属低价。本文将系统梳理2026年阿里云618活动的完整时间节点、官方参与入口、各类优惠细则、使用规则、热门产品推荐及实操代码,帮助用户精准参与、高效省钱,以最低成本完成上云部署。
1848 6
|
10天前
|
数据采集 人工智能 前端开发
让 Coding Agent 从黑盒到透明:阿里云 Agent 观测审计数据采集实践
AI Agent 规模化落地带来执行黑盒、行为难追溯、成本难度量三大难题。阿里云基于 OTel 标准,面向 Coding Agent、个人通用助理和框架型 Agent,推出 LoongSuite Pilot、插件及探针等无侵入采集方案,让 Agent 实现可看见、可分析、可审计、可治理。
774 152
|
10天前
|
人工智能 运维 自然语言处理
阿里云百炼Qwen3.7-Max模型详解:综合能力、核心优势与订阅计划参考指南
2026年,大模型技术持续向通用化、高性能、场景化方向迭代,阿里云百炼作为一站式大模型服务平台,持续推出迭代升级的模型产品,Qwen3.7-Max便是当前主力旗舰级大模型之一。该模型依托深度优化的底层架构与大规模训练数据,在文本理解、逻辑推理、多模态交互、代码生成、长文本处理等多个维度实现能力升级,同时搭配灵活的订阅计划体系,能够适配个人开发者、中小企业、大型企业、政企机构等不同类型用户的使用需求。
628 2