Agent六款开源记忆工具大横评——全都能本地跑,全都不花钱

简介: AI 编程助手每次开新会话就"失忆"?六款完全开源、免费、可本地部署的记忆扩展工具——agentmemory、QMD、Cognee、mem0、Zep、TencentDB Agent Memory,覆盖行为记忆、文档检索、知识图谱、时序感知四大能力。从零干预自动捕获到 Markdown 知识库搜索,再到多跳关系推理,帮你给 Hermes / OpenClaw 装上一套完整的持久记忆系统

你知道吗,让 Agent记住你的项目上下文、技术决策和工作习惯,这件事完全可以不花一分钱、不连任何云服务、数据全留在自己电脑上就做到。

每次打开 Hermes 或 OpenClaw 新建会话,你都得重新解释一遍项目用了什么框架、上次修 MCP 断线用的什么命令、为什么选 jose 而不是 jsonwebtoken。不是模型不够聪明,是上下文窗口本质上是"一次性"的——会话结束,记忆也跟着清零。

开源社区早就盯上了这个问题。过去一年里,至少有六款专门针对 Agent记忆扩展的开源工具冒了出来——全都开源免费、全都可以本地部署、而且功能一点不糊弄。

这篇文章就带你把这六款工具逐个看一遍:它们怎么工作的、怎么安装配置、各自有什么长处和短板、你的场景最适合哪个。

先搞清你需要哪种"记忆"

在聊具体工具之前,有一个关键区分要先说明白——AI 助手需要记的东西,其实分两种:

类型 问的问题 举例
行为/情节记忆 "我(Agent)上次怎么操作的?" "上次修复 MCP 断线用了什么命令?"
知识/文档记忆 "我知道什么资料?" "GEO 写作规范第三条怎么说的?"

前者记录 Agent 的操作历史,后者检索已有的文档知识库。两类需求适合不同的工具,最好的方案是搭配使用。

一、行为记忆类:让 Agent 记住"我做过什么"

1. agentmemory

GitHub:rohitg00/agentmemory(23,000+ Stars,MIT 协议)

agentmemory 是目前关注度最高的 AI 编程 Agent 持久记忆方案。它的核心卖点就一个词:零干预。Agent 执行工具调用时,它通过 Hook 机制自动静默捕获所有操作,你什么都不用管。

工作原理

每次 Agent(Hermes、Claude Code 等)调用工具时,agentmemory 捕获一条 Observation 记录:

{
  "toolName": "Write",
  "toolInput": { "file_path": "src/auth.ts" },
  "toolOutput": "OK",
  "sessionId": "ses_abc123",
  "project": "my-hermes-app",
  "cwd": "/Users/you/projects/my-hermes-app"
}

这些记录经过 iii-engine 压缩后存入本地 SQLite。下次新建会话时,agentmemory 自动检索相关历史上下文并注入进去。

检索机制:三流融合

这是 agentmemory 最值得细说的地方。它不是简单地做关键词搜索——它同时跑三路:BM25 全文检索、向量语义检索、知识图谱遍历,最后通过 RRF(Reciprocal Rank Fusion)融合排序。在 LongMemEval-S 基准测试上,召回率做到了 95.2%,而 mem0 只有 68.5%、Letta/MemGPT 是 83.2%。

典型使用场景
  • 记住项目里用了哪个库以及为什么选它("为什么用 jose 而不是 jsonwebtoken")
  • 跨会话继续上次没做完的任务
  • 自动规避曾经踩过的坑("这个 CORS 问题上次怎么解决的")
  • 多个 Agent 实例(Hermes + OpenClaw)共享同一份技术决策历史
安装配置
npm install -g @agentmemory/agentmemory
agentmemory connect hermes     # 接入 Hermes
agentmemory connect openclaw   # 接入 OpenClaw

在 ~/.hermes/config.yaml 中添加 MCP 服务配置即可。实时监控面板访问 http://localhost:3113,可以看到记忆构建过程、知识图谱和 Session Replay。

优点
  • 零干预,完全自动捕获,不需要手动维护任何文件
  • 零外部依赖,纯 SQLite,不需要 Docker 或额外服务
  • 多 Agent 共享,一个服务同时服务多个 Agent 实例
  • MIT 协议,完全本地运行,不连任何外部 LLM
  • 召回精度在同类工具中最高(95.2% R@5)
❌   缺点
  • 仅对接 Coding Agent,不适合通用 LLM 应用的用户画像场景
  • 默认 Embedding 模型(all-MiniLM-L6-v2,80MB)对中文支持一般,中文项目建议替换为 Qwen3-Embedding
  • 依赖 iii-engine 版本锁定(v0.11.2),升级需谨慎

值得注意的是,agentmemory 的记忆写入和检索均不调用任何 LLM,完全本地计算。这是它和 mem0 最大的区别之一。

2. mem0

GitHub:mem0ai/mem0(41,000+ Stars,Apache 2.0)

mem0 和 agentmemory 定位不同。它面向的是 LLM 应用(聊天机器人、个性化助手),从对话内容中自动提取结构化用户事实——偏好、习惯、身份信息——构建用户画像。

工作原理

每次对话结束后,mem0 调用 LLM 分析对话内容,提取出类似"这个用户喜欢 TypeScript、不喜欢冗余注释"的事实,写入向量数据库。下次对话时检索注入,实现个性化。

典型使用场景
  • 记住用户的编码风格偏好("喜欢函数式风格,不用 class")
  • 跨会话保持用户画像("这个用户在做 Electron 项目")
  • 构建面向终端用户的个性化 AI 产品
本地部署
docker run -p 6333:6333 qdrant/qdrant  # 需要本地向量数据库
pip install mem0ai
from mem0 import Memory
config = {
    "llm": {"provider": "ollama", "config": {"model": "qwen3:14b"}},
    "embedder": {"provider": "ollama", "config": {"model": "qwen3-embedding"}},
    "vector_store": {"provider": "qdrant", "config": {"host": "localhost"}}
}
m = Memory.from_config(config)
优点
  • 自动从对话提取事实,无需手动总结
  • 支持 MCP 接入,可集成到 Hermes/OpenClaw
  • 生态最成熟(YC 投资,14M+ 下载)
❌   缺点
  • 部署较重:需要 Qdrant 或 Chroma 等向量数据库(额外 Docker 服务)
  • 每次写入记忆时必须调用 LLM 提取事实(支持本地 Ollama/oMLX)
  • 与 agentmemory 定位不同,不适合替代后者

二、知识检索类:让 Agent 找到"我存了什么"

3. QMD

GitHub:Shopify CEO Tobi Lütke 发起,OpenClaw 生态核心工具(MIT 协议)

QMD(Quick Markdown Database)是专为 OpenClaw / Hermes 设计的本地 Markdown 知识库搜索引擎。它解决的问题不是"上次怎么做的",而是"我的笔记里写了什么"。

工作原理

QMD 对你 workspace 目录下的所有 Markdown 文件建立双索引——BM25 倒排索引加向量索引——查询时两路打分,再经 Reranker 融合排序,返回最相关的文本段落。三个本地模型自动下载,总共约 2.3GB:

模型角色 默认模型 大小
Embedding jina-embeddings-v3 (GGUF) 330 MB
Reranker jina-reranker-v2-base-multilingual (GGUF) 640 MB
Query Expansion 内置小 LLM 1.3 GB

中文项目可替换为 Qwen3-Embedding GGUF 以优化检索效果。

典型使用场景
  • 搜索技术笔记、架构设计文档("这个接口的设计原则")
  • 检索 GEO 写作规范("SEO 关键词密度要求")
  • 查找已有代码片段的说明("Aliyun OSS 签名上传的备注")
  • 作为 NotebookLM 的本地替代方案
安装配置
brew install qmd  # macOS
# 或 go install github.com/tobi-lmd/qmd@latest
# 建立索引
qmd embed ~/knowledge-base
# 作为 MCP 服务启动
qmd serve --port 7333
优点
  • 专为 Markdown 优化,OpenClaw 生态原生支持
  • 三模型管线检索质量高(BM25 + 向量 + Reranker)
  • 完全离线,模型下载一次后永久缓存
  • 支持多 Collection,不同项目知识库互相隔离
❌   缺点
  • 需要手动维护 Markdown 文件,不自动捕获 Agent 行为
  • 首次 qmd embed 下载约 2.3GB 模型
  • 对代码库和非 Markdown 文件支持有限

Query Expansion 阶段会调用内置小 LLM,增加查询延迟约 300ms,无需额外配置。

4. Cognee

GitHub:topoteretes/cognee(Apache 2.0)

Cognee 从根本上区别于 QMD:它不做文档相似度检索,而是从文档中提取知识图谱,回答"A 和 B 有什么关系"这类推理性问题。

工作原理:ECL 三阶段
  1. Extract:识别文档中的实体(模块、人员、概念、技术名词)
  2. Cognify:用 LLM 推断实体间关系(依赖/影响/属于),构建三元组
  3. Load:写入本地图数据库(默认 NetworkX 内存图,可换 Neo4j)

查询时通过图遍历而非向量相似度,能实现多跳推理。比如" MCP 断线 → 影响哪些 Agent → 这些 Agent 依赖哪些服务"——这种问题 QMD 是答不了的。

典型使用场景
  • 理解代码库中模块之间的依赖关系
  • 推断"A 功能崩溃会影响哪些下游"
  • 从多篇文档中综合出共同结论
  • 分析系统架构的影响链路
安装配置
pip install cognee
import cognee
cognee.config.set_llm_config({
    "provider": "ollama",
    "model": "qwen3:14b",
    "endpoint": "http://localhost:11434"  # 本地 oMLX/Ollama
})
await cognee.add("docs/")
await cognee.cognify()  # 提取知识图谱(慢,但只需一次)
results = await cognee.search("Hermes 和 MCP 的依赖关系")
优点
  • 独特的关系推理能力,是 QMD 做不到的
  • 内置图谱可视化 UI,直观看到知识关系网络
  • 支持 PDF、DOCX、音频、图片等多种格式
  • 答案相关性在关系推理类问题上达到 92.5%
❌   缺点
  • 索引速度慢,每篇文档都要跑 LLM 提取实体,约比 QMD 慢 5–10 倍
  • 查询延迟较高(图遍历 200ms–2s)
  • 对简单的文档检索需求属于"杀鸡用牛刀"

实体提取是 Cognee 的核心步骤,必须调用 LLM,但支持本地 Ollama/oMLX,完全免费。

三、时序与用户画像类

5. Zep(Community Edition)

GitHub:getzep/zep(Apache 2.0)

Zep 专注于时序感知记忆——它不仅记住"说了什么",还记住"什么时候说的、这条信息是否已被更新覆盖"。2026 年与 LangGraph 深度整合后关注度大增。

典型使用场景
  • "上周我说用 Redis,这周改成了 SQLite,以最新的为准"
  • 追踪项目决策的演化历史(某个技术方案经历了几次变更)
  • 需要时间线推理的复杂对话系统
本地部署
docker compose up  # 拉起 Postgres + pgvector + Zep 服务

LOCOMO 基准测试得分 75.14%,低于 agentmemory,但时序推理是其独有优势。

优点
  • 时序追踪是独特能力,其他工具都没有
  • 2026 年 LangGraph 官方集成,生态好
  • 企业级设计,支持大规模部署
❌   缺点
  • 需要 Postgres + pgvector,部署比较重
  • 对纯 Coding Agent 场景价值有限(agentmemory 更合适)


对比总览

功能与技术对比

工具 定位 写入方式 检索方式 本地依赖 需要 LLM 开源协议
agentmemory Coding Agent 行为记忆 自动 Hook BM25+向量+图谱 SQLite(零依赖) 不需要 MIT
mem0 用户画像/个性化 自动提取 向量检索 需要 Qdrant 需要 Apache 2.0
QMD Markdown 文档检索 手动写文件 BM25+向量+Reranker 本地 GGUF Query Expansion MIT
Cognee 知识图谱/关系推理 自动提取三元组 图遍历 本地(需 LLM) 必须 Apache 2.0
Zep CE 时序感知记忆 自动提取 向量+时序索引 Postgres+pgvector 需要 Apache 2.0

本地部署友好度

工具 磁盘占用 额外服务 部署难度
agentmemory ~80–600 MB(Embedding) 极简
QMD ~2.3 GB(3个GGUF模型) 极简
Cognee ~500 MB SDK + LLM 已有 Ollama/oMLX 简单
mem0 ~1 GB Qdrant(Docker) 中等
Zep CE ~2 GB Postgres + pgvector(Docker) 较复杂

检索精度对比

工具 评测得分 备注
agentmemory 95.2%(LongMemEval-S R@5) 三流融合检索
Letta/MemGPT 83.2% 供参考
mem0 68.5% 不同场景设计,不完全可比
Zep 75.14%(LOCOMO) 不同基准,侧重时序推理

各工具使用不同评测基准,数字不可直接横向比较,仅供参考。

怎么选?场景决策树

怎么选?场景决策树

推荐的组合方案

对于 OpenClaw / Hermes 的个人开发者,仙踪问道团队在实际部署中验证了一个三层搭配方案:

第一层用 agentmemory,自动捕获 Agent 行为历史,零干预,关掉不管它,它默默在后台记录所有的技术决策和操作。

第二层用 QMD,把重要的技术笔记、项目规范写成 Markdown,Agent 就能随时检索这些知识库。两个工具都作为 MCP Server 挂载,互不干扰,一个管"做过什么",一个管"知道什么"。

项目复杂度上去之后——代码库有好几个微服务、模块之间依赖关系复杂——再加 Cognee,引入图谱推理能力。三层就齐了:行为记忆 + 文档检索 + 关系推理。

# ~/.hermes/config.yaml
mcp_servers:
  agentmemory:
    command: "npx"
    args: ["@agentmemory/mcp"]
  qmd_search:
    command: "qmd"
    args: ["serve", "--port", "7333"]

归根结底,Agent的"失忆症"不是技术做不到,而是缺少一个中间层——一个能在会话之外持久化知识、跨会话注入上下文的记忆系统。开源社区给的这六款工具,就是在补这一层。它们全部开源免费、全都可以本地运行、数据留在自己的机器上。


附录:关键术语

  • MCP(Model Context Protocol):Anthropic 推出的开放协议,允许 LLM 通过标准接口调用外部工具和服务。agentmemory、QMD 等工具均提供 MCP Server,可直接挂载到 Hermes/OpenClaw
  • BM25:经典全文检索算法,基于词频和逆文档频率打分,速度快
  • 向量检索:将文本转化为高维数字向量,基于语义相似度检索
  • Reranker:对初步检索结果重新打分排序的模型
  • 知识图谱:以节点(实体)和边(关系)表示知识的图结构,支持多跳推理
  • LongMemEval-S:专门评测 AI Agent 跨会话长期记忆能力的标准基准测试集
相关文章
|
11天前
|
Apache 芯片 异构计算
刚发布的 Gemma4 12B 能打吗?三款最新顶流开源模型跑分全解读,堪比跟去年主流闭源模型
Gemma4 12B(6月3日刚发布)、Gemma4 26B A4B、Qwen3.6-35B-A3B,三款近期开源模型在 MMLU-Pro、GPQA Diamond、AIME 等评测中全面对标 Claude Sonnet 4 和 GPT-4.1 这两款 2025 年中闭源旗舰 ,数学科学推理甚至大幅领先。一文看懂跑分、架构差异和使用场景。
237 0
|
12天前
|
人工智能 算法 项目管理
Hermes Agent 总记不住你说的话?3 步治好 AI 助手的"健忘症"
Hermes Agent“健忘”源于核心记忆文件MEMORY.md仅2000字符容量,导致跨对话信息无法持久保存。本文详解三步解决方案:①扩容配置(治标);②启用8种外部记忆扩展(如Holographic、Mem0、Supermemory等,治本);③实时查看记忆状态。让AI真正记住你。
530 2
Hermes Agent 总记不住你说的话?3 步治好 AI 助手的"健忘症"
|
1月前
|
人工智能 安全 数据安全/隐私保护
Hermes Agent 登顶 OpenRouter 调用量第一,Agentic AI 时代已不可逆转
2026年5月,Hermes Agent以日均2710亿Token调用量登顶OpenRouter榜首,超越OpenClaw。其核心优势在于“越用越聪明”的自学习架构、三层记忆系统、零CVE安全设计,以及抓住OpenClaw创始人离任的生态窗口期,10周获11万GitHub Stars,标志Agentic AI正式进入生产级应用时代。
498 2
|
1月前
|
人工智能 搜索推荐 JavaScript
别再手动刷热搜了——我让Hermes每天自动分析热点和产品的结合点,还帮我出好了选题
Hermes Agent是Nous Research开源的自进化AI智能体(MIT协议),支持私有部署、持久记忆与闭环学习。本文介绍如何用它自动抓取微博、抖音等多平台热点,结合你的产品信息每日生成精准选题与大纲——三步配置,省去手动刷榜筛热的低效劳动。
681 2
|
1月前
|
人工智能 API
Hermes Agent如何快速配置Tavily搜索
Hermes Agent默认用浏览器搜索较慢,配置Tavily可大幅提升网络查询效率,且对国内网络友好。注册即享每月1000次免费调用,支持按量付费。只需两条命令设置API密钥与后端为tavily,重启生效。
744 3
Hermes Agent如何快速配置Tavily搜索
|
3月前
|
人工智能 安全 Linux
从“养虾”到“赚钱”:OpenClaw实战变现手册(阿里云/本地部署配置API+6大盈利路径+避坑指南)
2026年开年,开源AI智能体OpenClaw(昵称“小龙虾”)以现象级姿态席卷全网,GitHub星标数飙升至25.3万+,贡献者超880人,实现10+平台集成,仅用3周就达成了Linux操作系统30年的普及规模。这只“能替人干活的AI员工”不仅重构了办公与生活流程,更催生了“养虾人”这一全新群体——有人靠上门代部署日入2400元,有人靠技能插件售卖月入1.2万+,甚至有创业者靠行业定制化解决方案创收180万美元。
2172 4
|
人工智能 安全 Apache
QwenPaw:你的私人 AI 助理 —— 数据归你、记忆进化、多端触达的开源个人智能体
QwenPaw 是一款开源、本地优先的AI个人智能体(Apache 2.0),数据归属用户、记忆自主进化、支持钉钉/飞书/微信等多端触达。3行命令即可部署,内置Coding IDE、Persona人格、定时任务、MCP工具生态与多Agent协作,真正属于你的私有AI助理。
QwenPaw:你的私人 AI 助理 —— 数据归你、记忆进化、多端触达的开源个人智能体
|
1月前
|
人工智能 安全 Devops
Hermes Agent官方可选装Skills整理
Hermes Agent 内置90个技能,官方Skills Hub另提供70+可选技能(已剔除国内不可用项),覆盖AI代理、创意生成、DevOps、MLOps、健康、安全、研究等10余类场景,开箱即用,灵活扩展。
723 0
|
4月前
|
人工智能 API 机器人
OpenClaw 用户部署和使用指南汇总
本文档为OpenClaw(原MoltBot)官方使用指南,涵盖一键部署(阿里云轻量服务器年仅68元)、钉钉/飞书/企微等多平台AI员工搭建、典型场景实践及高频问题FAQ。同步更新产品化修复进展,助力用户高效落地7×24小时主动执行AI助手。
29820 253
|
3月前
|
人工智能 JavaScript 网络安全
OpenClaw阿里云/本地部署图文教程:自动化工作流搭建, 一个人顶一支团队
GitHub 超 20 万星的开源 AI 助手框架 OpenClaw(前身为 Clawdbot、Moltbot),早已不是简单的聊天工具——它能同时连接 WhatsApp、Telegram、飞书等十多个平台,通过技能组合、定时任务、模型协同,搭建全流程自动化工作流,真正实现“一个人顶一支团队”。但很多用户部署后仅停留在“能聊天”阶段,未能发挥其核心自动化价值。
4342 9