Agent六款开源记忆工具大横评——全都能本地跑，全都不花钱-阿里云开发者社区

你知道吗，让 Agent记住你的项目上下文、技术决策和工作习惯，这件事完全可以不花一分钱、不连任何云服务、数据全留在自己电脑上就做到。

每次打开 Hermes 或 OpenClaw 新建会话，你都得重新解释一遍项目用了什么框架、上次修 MCP 断线用的什么命令、为什么选 jose 而不是 jsonwebtoken。不是模型不够聪明，是上下文窗口本质上是"一次性"的——会话结束，记忆也跟着清零。

开源社区早就盯上了这个问题。过去一年里，至少有六款专门针对 Agent记忆扩展的开源工具冒了出来——全都开源免费、全都可以本地部署、而且功能一点不糊弄。

这篇文章就带你把这六款工具逐个看一遍：它们怎么工作的、怎么安装配置、各自有什么长处和短板、你的场景最适合哪个。

先搞清你需要哪种"记忆"

在聊具体工具之前，有一个关键区分要先说明白——AI 助手需要记的东西，其实分两种：

类型	问的问题	举例
行为/情节记忆	"我（Agent）上次怎么操作的？"	"上次修复 MCP 断线用了什么命令？"
知识/文档记忆	"我知道什么资料？"	"GEO 写作规范第三条怎么说的？"

前者记录 Agent 的操作历史，后者检索已有的文档知识库。两类需求适合不同的工具，最好的方案是搭配使用。

一、行为记忆类：让 Agent 记住"我做过什么"

1. agentmemory

GitHub：rohitg00/agentmemory（23,000+ Stars，MIT 协议）

agentmemory 是目前关注度最高的 AI 编程 Agent 持久记忆方案。它的核心卖点就一个词：零干预。Agent 执行工具调用时，它通过 Hook 机制自动静默捕获所有操作，你什么都不用管。

工作原理

每次 Agent（Hermes、Claude Code 等）调用工具时，agentmemory 捕获一条 Observation 记录：

{
  "toolName": "Write",
  "toolInput": { "file_path": "src/auth.ts" },
  "toolOutput": "OK",
  "sessionId": "ses_abc123",
  "project": "my-hermes-app",
  "cwd": "/Users/you/projects/my-hermes-app"
}

这些记录经过 iii-engine 压缩后存入本地 SQLite。下次新建会话时，agentmemory 自动检索相关历史上下文并注入进去。

检索机制：三流融合

这是 agentmemory 最值得细说的地方。它不是简单地做关键词搜索——它同时跑三路：BM25 全文检索、向量语义检索、知识图谱遍历，最后通过 RRF（Reciprocal Rank Fusion）融合排序。在 LongMemEval-S 基准测试上，召回率做到了 95.2%，而 mem0 只有 68.5%、Letta/MemGPT 是 83.2%。

典型使用场景

记住项目里用了哪个库以及为什么选它（"为什么用 jose 而不是 jsonwebtoken"）
跨会话继续上次没做完的任务
自动规避曾经踩过的坑（"这个 CORS 问题上次怎么解决的"）
多个 Agent 实例（Hermes + OpenClaw）共享同一份技术决策历史

安装配置

npm install -g @agentmemory/agentmemory
agentmemory connect hermes     # 接入 Hermes
agentmemory connect openclaw   # 接入 OpenClaw

在 ~/.hermes/config.yaml 中添加 MCP 服务配置即可。实时监控面板访问 http://localhost:3113，可以看到记忆构建过程、知识图谱和 Session Replay。

✅ 优点

零干预，完全自动捕获，不需要手动维护任何文件
零外部依赖，纯 SQLite，不需要 Docker 或额外服务
多 Agent 共享，一个服务同时服务多个 Agent 实例
MIT 协议，完全本地运行，不连任何外部 LLM
召回精度在同类工具中最高（95.2% R@5）

❌ 缺点

仅对接 Coding Agent，不适合通用 LLM 应用的用户画像场景
默认 Embedding 模型（all-MiniLM-L6-v2，80MB）对中文支持一般，中文项目建议替换为 Qwen3-Embedding
依赖 iii-engine 版本锁定（v0.11.2），升级需谨慎

值得注意的是，agentmemory 的记忆写入和检索均不调用任何 LLM，完全本地计算。这是它和 mem0 最大的区别之一。

2. mem0

GitHub：mem0ai/mem0（41,000+ Stars，Apache 2.0）

mem0 和 agentmemory 定位不同。它面向的是 LLM 应用（聊天机器人、个性化助手），从对话内容中自动提取结构化用户事实——偏好、习惯、身份信息——构建用户画像。

工作原理

每次对话结束后，mem0 调用 LLM 分析对话内容，提取出类似"这个用户喜欢 TypeScript、不喜欢冗余注释"的事实，写入向量数据库。下次对话时检索注入，实现个性化。

典型使用场景

记住用户的编码风格偏好（"喜欢函数式风格，不用 class"）
跨会话保持用户画像（"这个用户在做 Electron 项目"）
构建面向终端用户的个性化 AI 产品

本地部署

docker run -p 6333:6333 qdrant/qdrant  # 需要本地向量数据库
pip install mem0ai

from mem0 import Memory
config = {
    "llm": {"provider": "ollama", "config": {"model": "qwen3:14b"}},
    "embedder": {"provider": "ollama", "config": {"model": "qwen3-embedding"}},
    "vector_store": {"provider": "qdrant", "config": {"host": "localhost"}}
}
m = Memory.from_config(config)

✅ 优点

自动从对话提取事实，无需手动总结
支持 MCP 接入，可集成到 Hermes/OpenClaw
生态最成熟（YC 投资，14M+ 下载）

❌ 缺点

部署较重：需要 Qdrant 或 Chroma 等向量数据库（额外 Docker 服务）
每次写入记忆时必须调用 LLM 提取事实（支持本地 Ollama/oMLX）
与 agentmemory 定位不同，不适合替代后者

二、知识检索类：让 Agent 找到"我存了什么"

3. QMD

GitHub：Shopify CEO Tobi Lütke 发起，OpenClaw 生态核心工具（MIT 协议）

QMD（Quick Markdown Database）是专为 OpenClaw / Hermes 设计的本地 Markdown 知识库搜索引擎。它解决的问题不是"上次怎么做的"，而是"我的笔记里写了什么"。

工作原理

QMD 对你 workspace 目录下的所有 Markdown 文件建立双索引——BM25 倒排索引加向量索引——查询时两路打分，再经 Reranker 融合排序，返回最相关的文本段落。三个本地模型自动下载，总共约 2.3GB：

模型角色	默认模型	大小
Embedding	jina-embeddings-v3 (GGUF)	330 MB
Reranker	jina-reranker-v2-base-multilingual (GGUF)	640 MB
Query Expansion	内置小 LLM	1.3 GB

中文项目可替换为 Qwen3-Embedding GGUF 以优化检索效果。

典型使用场景

搜索技术笔记、架构设计文档（"这个接口的设计原则"）
检索 GEO 写作规范（"SEO 关键词密度要求"）
查找已有代码片段的说明（"Aliyun OSS 签名上传的备注"）
作为 NotebookLM 的本地替代方案

安装配置

brew install qmd  # macOS
# 或 go install github.com/tobi-lmd/qmd@latest
# 建立索引
qmd embed ~/knowledge-base
# 作为 MCP 服务启动
qmd serve --port 7333

✅ 优点

专为 Markdown 优化，OpenClaw 生态原生支持
三模型管线检索质量高（BM25 + 向量 + Reranker）
完全离线，模型下载一次后永久缓存
支持多 Collection，不同项目知识库互相隔离

❌ 缺点

需要手动维护 Markdown 文件，不自动捕获 Agent 行为
首次 qmd embed 下载约 2.3GB 模型
对代码库和非 Markdown 文件支持有限

Query Expansion 阶段会调用内置小 LLM，增加查询延迟约 300ms，无需额外配置。

4. Cognee

GitHub：topoteretes/cognee（Apache 2.0）

Cognee 从根本上区别于 QMD：它不做文档相似度检索，而是从文档中提取知识图谱，回答"A 和 B 有什么关系"这类推理性问题。

工作原理：ECL 三阶段

Extract：识别文档中的实体（模块、人员、概念、技术名词）
Cognify：用 LLM 推断实体间关系（依赖/影响/属于），构建三元组
Load：写入本地图数据库（默认 NetworkX 内存图，可换 Neo4j）

查询时通过图遍历而非向量相似度，能实现多跳推理。比如" MCP 断线 → 影响哪些 Agent → 这些 Agent 依赖哪些服务"——这种问题 QMD 是答不了的。

典型使用场景

理解代码库中模块之间的依赖关系
推断"A 功能崩溃会影响哪些下游"
从多篇文档中综合出共同结论
分析系统架构的影响链路

安装配置

pip install cognee

import cognee
cognee.config.set_llm_config({
    "provider": "ollama",
    "model": "qwen3:14b",
    "endpoint": "http://localhost:11434"  # 本地 oMLX/Ollama
})
await cognee.add("docs/")
await cognee.cognify()  # 提取知识图谱（慢，但只需一次）
results = await cognee.search("Hermes 和 MCP 的依赖关系")

✅ 优点

独特的关系推理能力，是 QMD 做不到的
内置图谱可视化 UI，直观看到知识关系网络
支持 PDF、DOCX、音频、图片等多种格式
答案相关性在关系推理类问题上达到 92.5%

❌ 缺点

索引速度慢，每篇文档都要跑 LLM 提取实体，约比 QMD 慢 5–10 倍
查询延迟较高（图遍历 200ms–2s）
对简单的文档检索需求属于"杀鸡用牛刀"

实体提取是 Cognee 的核心步骤，必须调用 LLM，但支持本地 Ollama/oMLX，完全免费。

三、时序与用户画像类

5. Zep（Community Edition）

GitHub：getzep/zep（Apache 2.0）

Zep 专注于时序感知记忆——它不仅记住"说了什么"，还记住"什么时候说的、这条信息是否已被更新覆盖"。2026 年与 LangGraph 深度整合后关注度大增。

典型使用场景

"上周我说用 Redis，这周改成了 SQLite，以最新的为准"
追踪项目决策的演化历史（某个技术方案经历了几次变更）
需要时间线推理的复杂对话系统

本地部署

docker compose up  # 拉起 Postgres + pgvector + Zep 服务

LOCOMO 基准测试得分 75.14%，低于 agentmemory，但时序推理是其独有优势。

✅ 优点

时序追踪是独特能力，其他工具都没有
2026 年 LangGraph 官方集成，生态好
企业级设计，支持大规模部署

❌ 缺点

需要 Postgres + pgvector，部署比较重
对纯 Coding Agent 场景价值有限（agentmemory 更合适）

对比总览

功能与技术对比

工具	定位	写入方式	检索方式	本地依赖	需要 LLM	开源协议
agentmemory	Coding Agent 行为记忆	自动 Hook	BM25+向量+图谱	SQLite（零依赖）	不需要	MIT
mem0	用户画像/个性化	自动提取	向量检索	需要 Qdrant	需要	Apache 2.0
QMD	Markdown 文档检索	手动写文件	BM25+向量+Reranker	本地 GGUF	Query Expansion	MIT
Cognee	知识图谱/关系推理	自动提取三元组	图遍历	本地（需 LLM）	必须	Apache 2.0
Zep CE	时序感知记忆	自动提取	向量+时序索引	Postgres+pgvector	需要	Apache 2.0

本地部署友好度

工具	磁盘占用	额外服务	部署难度
agentmemory	~80–600 MB（Embedding）	无	极简
QMD	~2.3 GB（3个GGUF模型）	无	极简
Cognee	~500 MB SDK + LLM	已有 Ollama/oMLX	简单
mem0	~1 GB	Qdrant（Docker）	中等
Zep CE	~2 GB	Postgres + pgvector（Docker）	较复杂

检索精度对比

工具	评测得分	备注
agentmemory	95.2%（LongMemEval-S R@5）	三流融合检索
Letta/MemGPT	83.2%	供参考
mem0	68.5%	不同场景设计，不完全可比
Zep	75.14%（LOCOMO）	不同基准，侧重时序推理

各工具使用不同评测基准，数字不可直接横向比较，仅供参考。

怎么选？场景决策树

附录：关键术语

MCP（Model Context Protocol）：Anthropic 推出的开放协议，允许 LLM 通过标准接口调用外部工具和服务。agentmemory、QMD 等工具均提供 MCP Server，可直接挂载到 Hermes/OpenClaw
BM25：经典全文检索算法，基于词频和逆文档频率打分，速度快
向量检索：将文本转化为高维数字向量，基于语义相似度检索
Reranker：对初步检索结果重新打分排序的模型
知识图谱：以节点（实体）和边（关系）表示知识的图结构，支持多跳推理
LongMemEval-S：专门评测 AI Agent 跨会话长期记忆能力的标准基准测试集

Agent六款开源记忆工具大横评——全都能本地跑，全都不花钱

先搞清你需要哪种"记忆"

一、行为记忆类：让 Agent 记住"我做过什么"

1. agentmemory

2. mem0

二、知识检索类：让 Agent 找到"我存了什么"

3. QMD

4. Cognee

三、时序与用户画像类

5. Zep（Community Edition）

对比总览

功能与技术对比

本地部署友好度

检索精度对比

怎么选？场景决策树

推荐的组合方案

附录：关键术语

热门文章

最新文章

相关电子书

探索云世界

热门

云计算

大数据

云原生

人工智能

数据库

开发与运维

活动广场

任务中心

训练营

直播

乘风者计划

下载

镜像站

技术资料

Agent六款开源记忆工具大横评——全都能本地跑，全都不花钱

先搞清你需要哪种"记忆"

一、行为记忆类：让 Agent 记住"我做过什么"

1. agentmemory

2. mem0

二、知识检索类：让 Agent 找到"我存了什么"

3. QMD

4. Cognee

三、时序与用户画像类

5. Zep（Community Edition）

对比总览

功能与技术对比

本地部署友好度

检索精度对比

怎么选？场景决策树

推荐的组合方案

附录：关键术语

热门文章

最新文章

相关电子书