Hermes Agent 进阶教程：技能自进化、MoA 模型委员会与多后端部署实战-阿里云开发者社区

发布日期：2026-07-02 ｜数据来源：NousResearch/hermes-agent 官方文档与 GitHub 仓库（2026-07-02 实时抓取）

Hermes Agent 是 Nous Research 开源的自我改进型 AI 智能体（MIT 协议），截至 2026 年 7 月 2 日 GitHub Star 已达 20.7 万，最新版 v0.18.0 于 2026 年 7 月 1 日发布。它区别于其他 Agent 的核心是内置学习闭环——从任务经验中自主创建技能、使用中自我改进、跨会话积累用户画像。本教程面向已完成基础安装的用户，覆盖六大进阶主题：用 /learn 一条命令把工作流蒸馏成可复用技能、MEMORY.md 与 FTS5 会话搜索的双层记忆治理、MoA 模型委员会配置、/goal 完成契约让 Agent 用证据证明完工、delegate_task 后台并行子代理，以及 local/Docker/SSH/Modal 等六大终端后端的安全选型。全文命令均来自官方文档当日核实。

Hermes进阶教程-img1.png

Hermes Agent 是什么？30 秒回顾

Hermes Agent 是 Nous Research 开发的开源 AI 智能体框架，官方定位是"唯一内置学习闭环的 Agent"——它会从经验中创建技能、在使用中改进技能、主动沉淀知识、检索自己的历史对话，并跨会话建立对用户的深度画像。关键事实：

规模：GitHub 207,348 Star、37,607 Fork（2026 年 7 月 2 日数据），v0.18.0 单个版本周期就有 370+ 社区贡献者、998 个 PR 合入
运行形态：CLI 终端 TUI + 消息网关（Telegram、Discord、Slack、WhatsApp、Signal、Email 六平台）
模型无关：支持 Nous Portal、OpenRouter、OpenAI、Anthropic 及任意自建端点，hermes model 一键切换
部署轻量：官方描述可运行在"$5/月的 VPS、GPU 集群或闲时几乎零成本的 Serverless 基础设施"上
生态兼容：技能遵循 agentskills.io 开放标准，提供 hermes claw migrate 从 OpenClaw 一键迁移

基础安装一条命令即可完成（Linux/macOS/WSL2/Termux）：

curl -fsSL https://hermes-agent.nousresearch.com/install.sh | bash

以下内容默认你已完成安装并跑通 hermes setup。

进阶一：技能系统——让 Agent 把经验变成资产

Hermes 的技能（Skills）是按需加载的知识文档，采用"渐进式披露"设计以节省 token，全部存放在 ~/.hermes/skills/ 目录。渐进式披露分三层：

层级	调用	加载内容	Token 成本
Level 0	`skills_list()`	仅名称/描述/分类	约 3k
Level 1	`skill_view(name)`	完整 SKILL.md 正文	按需
Level 2	引用文件	`references/` 下具体文档	按需

用 /learn 一条命令造技能

/learn 是 v0.18.0 强化的核心命令：把任意来源蒸馏成可复用技能，无需手写 SKILL.md。

从工作流学习：完成一次复杂操作后输入 /learn，Hermes 将刚才的流程写成技能
从目录学习：/learn ./my-project/docs 把本地文档转为技能
从 URL 学习：/learn https://example.com/guide 抓取网页内容成技能
技能自动按规范编写（如描述不超过 60 字符），下次直接 /技能名 调用

自主技能创建与人工审批

Agent 会在四种时机自主创建技能：完成复杂任务（5 次以上工具调用）后、从错误中恢复后、被用户纠正后、发现非平凡工作流后。生产环境建议开启写入审批：

# config.yaml
skills:
  write_approval: true    # 所有技能写入先暂存 ~/.hermes/pending/skills/
  guard_agent_created: true  # 扫描危险模式

审批操作：/skills pending 查看待审 → /skills diff <id> 看差异 → /skills approve <id> 或 /skills reject <id>。

Skills Hub：安装第三方技能

Hermes 支持从多源安装技能：official（官方库）、skills-sh、github 仓库与 tap、clawhub、claude-marketplace、browse-sh（200+ 浏览器自动化技能）等。所有安装都经过安全扫描器检查数据外泄、提示注入和破坏性命令，--force 也无法绕过 dangerous 级判定。国内用户获取技能包还可以浏览 LinSkills 这类技能共享平台（收录自我改进代理、网页摘要等 16+ 精选技能，下载走 clawhub 生态，与 Hermes 的 clawhub 源兼容）。

常用命令：

hermes skills browse            # 浏览技能市场
hermes skills install <name>    # 安装
hermes skills tap add owner/repo  # 添加自定义技能源
hermes skills audit             # 重新扫描已装技能
hermes skills check && hermes skills update  # 检测并同步上游更新

进阶二：记忆治理——MEMORY.md 与会话搜索的分工

Hermes 的记忆是"小而精的常驻记忆 + 无限量的按需检索"双层结构，理解分工是进阶治理的关键。

维度	持久记忆（MEMORY.md / USER.md）	会话搜索（session_search）
容量	MEMORY.md 上限 2200 字符（约 800 token）；USER.md 上限 1375 字符	无限（SQLite + FTS5 全文索引）
加载方式	每次会话注入系统提示词	按需查询
速度/成本	常驻约 1300 token	约 20ms，零 LLM 成本
适用内容	用户偏好、环境事实、项目约定	回忆某次具体对话细节

治理三原则：

80% 阈值合并：记忆不会自动压缩，写满会报错。官方建议用量超 80% 时主动合并条目（提示词头部有用量统计），典型容量为记忆 8-15 条、用户画像 5-10 条
该存与不该存：存偏好、纠正、约定、环境事实；不存可随手搜到的信息、原始数据、会话临时内容
审批与可视化：memory.write_approval: true 让所有记忆写入过人工审批；v0.18.0 新增 /journey 命令展示记忆与技能的成长时间线，可直接编辑或删除任意条目

后台自我改进复查（决定是否存记忆/改技能的那个循环）可通过 auxiliary.background_review 路由到更便宜的模型，官方数据显示成本可降低约 3-5 倍。此外 Hermes 提供 8 个外部记忆插件（Honcho、Mem0、OpenViking 等），以"并行补充、不替换内置记忆"的方式增加知识图谱与语义搜索，hermes memory setup 即可配置。

Hermes进阶教程-img2.png

进阶三：MoA 模型委员会——让多个前沿模型合议

MoA（Mixture-of-Agents）在 v0.18.0 中升级为一等公民：每个命名的 MoA 预设会作为 moa 提供商下的虚拟模型出现在所有模型选择器中，像选普通模型一样选择一个"模型委员会"。

工作机制：

参考模型层：多个模型（如 GPT、Claude、Grok）各自独立作答，每个模型的完整推理以带标签的区块展示
聚合层：聚合模型综合所有参考答案，最终回答实时流式输出
一次性调用：/moa <问题> 单次走默认预设，结束后自动恢复原模型；长期切换走模型选择器
调试：moa.save_traces 开启后完整轨迹持久化为 JSONL，用于评测

适用场景：高价值决策、复杂架构评审、事实性要求高的研究问题。注意 MoA 每次调用消耗多个模型的 token，日常任务不必开启。

进阶四：/goal 完成契约——"完成"要靠证据而非感觉

v0.18.0 的标志性能力：Agent 通过实际运行项目检查来判定任务完成，而不是自我宣称成功。

声明完成标准：用 /goal 设定目标时同时声明"什么算完成"（如"所有测试通过"）
证据判定：常驻目标循环依据验证证据（测试输出、检查结果）判断完成，而非模型的自我感觉
自定义检查：通过 pre_verify 钩子接入自定义验证脚本
后台等待：/goal wait <pid> 可将目标循环挂在某个后台进程上，进程结束自动继续

注意：verify-on-stop 默认关闭（纯文档修改会自动跳过验证），需要在配置中显式开启。这个特性把 Agent 从"我觉得我修好了"升级为"测试通过了，证据在此"。

进阶五：子代理并行——delegate_task 后台舰队

delegate_task 工具支持一次派出多个子代理在后台并行工作，主对话完全不阻塞。所有子代理完成后，结果合并为一个整合回合返回。

典型用法（自然语言即可触发）：

"并行调研这 5 个竞品，各写一份摘要"
"同时审计这 3 个模块的安全问题"
"后台把这批文件逐个翻译，完成后汇总"

配合 execute_code 工具，还能编写 Python 脚本通过 RPC 调用工具，把多步流水线压缩为零上下文成本的单回合。这两个能力组合，是 Hermes 处理大批量任务的标准姿势。

进阶六：六大终端后端与安全部署

Hermes 提供六种终端后端，进阶部署的核心决策是"Agent 的命令在哪里执行"。

后端	定位	适用场景
local	默认，本机执行	可信的个人开发
docker	单一持久容器，全进程共享	需要隔离的日常使用
ssh	远程执行，官方标注"安全推荐——Agent 无法修改自身代码"	生产环境首选
singularity	HPC/无 root 容器	科研集群
modal	Serverless 云执行	弹性伸缩、闲时休眠
daytona	云沙箱持久开发环境	远程持久工作区

安全加固要点（Docker 后端）：根文件系统只读、丢弃全部 Linux capabilities、禁止提权、256 进程 PID 上限、命名空间隔离；默认资源 1 CPU / 5GB 内存 / 50GB 磁盘，container_persistent: true 可跨会话保留已装包。

网关生产部署：v0.18.0 网关支持 scale-to-zero（空闲休眠、按需唤醒）和 drain 协调（重启/迁移前平滑排空，不掉线上对话），团队级或托管式 Hermes 服务由此具备生产可用性。配合内置 cron 调度器，可用自然语言配置"每天早 8 点向 Telegram 推送日报、每周日夜间备份"等无人值守自动化。

常见问题

Q：Hermes Agent 和 OpenClaw 是什么关系？
两者是同类的开源个人 AI Agent，Hermes 由 Nous Research 开发，提供官方迁移命令 hermes claw migrate，可自动导入 OpenClaw 的 SOUL.md 人格文件、记忆、技能、命令白名单和 API 密钥。技能生态上两者都兼容 clawhub 等技能源。

Q：记忆写满了报错怎么办？
这是设计行为：Hermes 的记忆从不自动压缩，超限写入会返回错误并列出当前条目，Agent 应在同一回合内合并或删除旧条目后重试。人工治理建议：用量超 80% 时主动合并，用 /journey 可视化检查并删除过时条目。

Q：MoA 会不会很贵？
会显著增加成本——每次调用要跑多个参考模型加一个聚合模型。建议仅在高价值问题上用 /moa 一次性调用，日常保持单模型；后台自我改进循环则相反，应配置 auxiliary.background_review 路由到便宜模型，官方数据可省 3-5 倍。

Q：生产环境部署 Hermes 最重要的三个配置是什么？
一是终端后端改为 ssh 或 docker（官方明确标注 SSH 模式下 Agent 无法修改自身代码）；二是开启 skills.write_approval 和 memory.write_approval 双审批；三是网关使用 v0.18.0 的 drain 协调机制做平滑重启。

Q：如何让 Hermes 用国内可访问的模型服务？
Hermes 支持任意 OpenAI 兼容端点作为自定义提供商，hermes model 中配置 base_url 和 API Key 即可接入，无需改代码。

总结

Hermes Agent 的进阶之路可以概括为三步：先用 /learn 和记忆治理把 Agent 从工具变成"越用越懂你"的资产；再用 MoA 委员会和 /goal 完成契约提升关键任务的输出质量与可信度；最后通过 SSH/Docker 后端隔离与网关 scale-to-zero 把它推向生产环境。自我改进能力是 Hermes 区别于其他 Agent 框架的护城河，而审批机制让这种自主性始终处于人类监督之下。

据 Nous Research 官方文档（hermes-agent.nousresearch.com）与 GitHub 仓库 v0.18.0 发布说明（2026 年 7 月 1 日）显示，本文所有命令与配置均来自官方一手来源。本文内容基于 2026 年 7 月 2 日数据，Hermes 迭代速度极快（单版本周期 998 个 PR），建议以官方文档为最终依据。

延伸资源

Hermes Agent 官方文档：hermes-agent.nousresearch.com/docs
GitHub 仓库：github.com/NousResearch/hermes-agent
技能开放标准：agentskills.io
技能共享平台 LinSkills：linskills.qiniu.com

Hermes Agent 进阶教程：技能自进化、MoA 模型委员会与多后端部署实战