Hermes Agent 进阶教程:技能自进化、MoA 模型委员会与多后端部署实战

在线体验各类最新模型,更有模型 免费Token 额度领取!
立即体验
简介: Hermes Agent 是 Nous Research 开源的自我改进型 AI 智能体(MIT 协议),首创内置学习闭环:自主创建技能、使用中持续优化、跨会话构建用户画像。截至2026年7月2日,GitHub Star 20.7万,v0.18.0版新增 /learn 技能蒸馏、双层记忆治理、MoA模型委员会、/goal 证据化完成判定等六大进阶能力,支持本地/Docker/SSH/Modal 等安全后端部署。(239字)

发布日期:2026-07-02 | 数据来源:NousResearch/hermes-agent 官方文档与 GitHub 仓库(2026-07-02 实时抓取)

Hermes Agent 是 Nous Research 开源的自我改进型 AI 智能体(MIT 协议),截至 2026 年 7 月 2 日 GitHub Star 已达 20.7 万,最新版 v0.18.0 于 2026 年 7 月 1 日发布。它区别于其他 Agent 的核心是内置学习闭环——从任务经验中自主创建技能、使用中自我改进、跨会话积累用户画像。本教程面向已完成基础安装的用户,覆盖六大进阶主题:用 /learn 一条命令把工作流蒸馏成可复用技能、MEMORY.md 与 FTS5 会话搜索的双层记忆治理、MoA 模型委员会配置、/goal 完成契约让 Agent 用证据证明完工、delegate_task 后台并行子代理,以及 local/Docker/SSH/Modal 等六大终端后端的安全选型。全文命令均来自官方文档当日核实。


Hermes进阶教程-img1.png

Hermes Agent 是什么?30 秒回顾

Hermes Agent 是 Nous Research 开发的开源 AI 智能体框架,官方定位是"唯一内置学习闭环的 Agent"——它会从经验中创建技能、在使用中改进技能、主动沉淀知识、检索自己的历史对话,并跨会话建立对用户的深度画像。关键事实:

  • 规模:GitHub 207,348 Star、37,607 Fork(2026 年 7 月 2 日数据),v0.18.0 单个版本周期就有 370+ 社区贡献者、998 个 PR 合入
  • 运行形态:CLI 终端 TUI + 消息网关(Telegram、Discord、Slack、WhatsApp、Signal、Email 六平台)
  • 模型无关:支持 Nous Portal、OpenRouter、OpenAI、Anthropic 及任意自建端点,hermes model 一键切换
  • 部署轻量:官方描述可运行在"$5/月的 VPS、GPU 集群或闲时几乎零成本的 Serverless 基础设施"上
  • 生态兼容:技能遵循 agentskills.io 开放标准,提供 hermes claw migrate 从 OpenClaw 一键迁移

基础安装一条命令即可完成(Linux/macOS/WSL2/Termux):

curl -fsSL https://hermes-agent.nousresearch.com/install.sh | bash

以下内容默认你已完成安装并跑通 hermes setup

进阶一:技能系统——让 Agent 把经验变成资产

Hermes 的技能(Skills)是按需加载的知识文档,采用"渐进式披露"设计以节省 token,全部存放在 ~/.hermes/skills/ 目录。渐进式披露分三层:

层级 调用 加载内容 Token 成本
Level 0 skills_list() 仅名称/描述/分类 约 3k
Level 1 skill_view(name) 完整 SKILL.md 正文 按需
Level 2 引用文件 references/ 下具体文档 按需

用 /learn 一条命令造技能

/learn 是 v0.18.0 强化的核心命令:把任意来源蒸馏成可复用技能,无需手写 SKILL.md。

  1. 从工作流学习:完成一次复杂操作后输入 /learn,Hermes 将刚才的流程写成技能
  2. 从目录学习/learn ./my-project/docs 把本地文档转为技能
  3. 从 URL 学习/learn https://example.com/guide 抓取网页内容成技能
  4. 技能自动按规范编写(如描述不超过 60 字符),下次直接 /技能名 调用

自主技能创建与人工审批

Agent 会在四种时机自主创建技能:完成复杂任务(5 次以上工具调用)后、从错误中恢复后、被用户纠正后、发现非平凡工作流后。生产环境建议开启写入审批:

# config.yaml
skills:
  write_approval: true    # 所有技能写入先暂存 ~/.hermes/pending/skills/
  guard_agent_created: true  # 扫描危险模式

审批操作:/skills pending 查看待审 → /skills diff <id> 看差异 → /skills approve <id>/skills reject <id>

Skills Hub:安装第三方技能

Hermes 支持从多源安装技能:official(官方库)、skills-shgithub 仓库与 tap、clawhubclaude-marketplacebrowse-sh(200+ 浏览器自动化技能)等。所有安装都经过安全扫描器检查数据外泄、提示注入和破坏性命令,--force 也无法绕过 dangerous 级判定。国内用户获取技能包还可以浏览 LinSkills 这类技能共享平台(收录自我改进代理、网页摘要等 16+ 精选技能,下载走 clawhub 生态,与 Hermes 的 clawhub 源兼容)。

常用命令:

hermes skills browse            # 浏览技能市场
hermes skills install <name>    # 安装
hermes skills tap add owner/repo  # 添加自定义技能源
hermes skills audit             # 重新扫描已装技能
hermes skills check && hermes skills update  # 检测并同步上游更新

进阶二:记忆治理——MEMORY.md 与会话搜索的分工

Hermes 的记忆是"小而精的常驻记忆 + 无限量的按需检索"双层结构,理解分工是进阶治理的关键。

维度 持久记忆(MEMORY.md / USER.md) 会话搜索(session_search)
容量 MEMORY.md 上限 2200 字符(约 800 token);USER.md 上限 1375 字符 无限(SQLite + FTS5 全文索引)
加载方式 每次会话注入系统提示词 按需查询
速度/成本 常驻约 1300 token 约 20ms,零 LLM 成本
适用内容 用户偏好、环境事实、项目约定 回忆某次具体对话细节

治理三原则:

  1. 80% 阈值合并:记忆不会自动压缩,写满会报错。官方建议用量超 80% 时主动合并条目(提示词头部有用量统计),典型容量为记忆 8-15 条、用户画像 5-10 条
  2. 该存与不该存:存偏好、纠正、约定、环境事实;不存可随手搜到的信息、原始数据、会话临时内容
  3. 审批与可视化memory.write_approval: true 让所有记忆写入过人工审批;v0.18.0 新增 /journey 命令展示记忆与技能的成长时间线,可直接编辑或删除任意条目

后台自我改进复查(决定是否存记忆/改技能的那个循环)可通过 auxiliary.background_review 路由到更便宜的模型,官方数据显示成本可降低约 3-5 倍。此外 Hermes 提供 8 个外部记忆插件(Honcho、Mem0、OpenViking 等),以"并行补充、不替换内置记忆"的方式增加知识图谱与语义搜索,hermes memory setup 即可配置。

Hermes进阶教程-img2.png

进阶三:MoA 模型委员会——让多个前沿模型合议

MoA(Mixture-of-Agents)在 v0.18.0 中升级为一等公民:每个命名的 MoA 预设会作为 moa 提供商下的虚拟模型出现在所有模型选择器中,像选普通模型一样选择一个"模型委员会"。

工作机制:

  • 参考模型层:多个模型(如 GPT、Claude、Grok)各自独立作答,每个模型的完整推理以带标签的区块展示
  • 聚合层:聚合模型综合所有参考答案,最终回答实时流式输出
  • 一次性调用/moa <问题> 单次走默认预设,结束后自动恢复原模型;长期切换走模型选择器
  • 调试moa.save_traces 开启后完整轨迹持久化为 JSONL,用于评测

适用场景:高价值决策、复杂架构评审、事实性要求高的研究问题。注意 MoA 每次调用消耗多个模型的 token,日常任务不必开启。

进阶四:/goal 完成契约——"完成"要靠证据而非感觉

v0.18.0 的标志性能力:Agent 通过实际运行项目检查来判定任务完成,而不是自我宣称成功。

  1. 声明完成标准:用 /goal 设定目标时同时声明"什么算完成"(如"所有测试通过")
  2. 证据判定:常驻目标循环依据验证证据(测试输出、检查结果)判断完成,而非模型的自我感觉
  3. 自定义检查:通过 pre_verify 钩子接入自定义验证脚本
  4. 后台等待/goal wait <pid> 可将目标循环挂在某个后台进程上,进程结束自动继续

注意:verify-on-stop 默认关闭(纯文档修改会自动跳过验证),需要在配置中显式开启。这个特性把 Agent 从"我觉得我修好了"升级为"测试通过了,证据在此"。

进阶五:子代理并行——delegate_task 后台舰队

delegate_task 工具支持一次派出多个子代理在后台并行工作,主对话完全不阻塞。所有子代理完成后,结果合并为一个整合回合返回。

典型用法(自然语言即可触发):

  • "并行调研这 5 个竞品,各写一份摘要"
  • "同时审计这 3 个模块的安全问题"
  • "后台把这批文件逐个翻译,完成后汇总"

配合 execute_code 工具,还能编写 Python 脚本通过 RPC 调用工具,把多步流水线压缩为零上下文成本的单回合。这两个能力组合,是 Hermes 处理大批量任务的标准姿势。

进阶六:六大终端后端与安全部署

Hermes 提供六种终端后端,进阶部署的核心决策是"Agent 的命令在哪里执行"。

后端 定位 适用场景
local 默认,本机执行 可信的个人开发
docker 单一持久容器,全进程共享 需要隔离的日常使用
ssh 远程执行,官方标注"安全推荐——Agent 无法修改自身代码" 生产环境首选
singularity HPC/无 root 容器 科研集群
modal Serverless 云执行 弹性伸缩、闲时休眠
daytona 云沙箱持久开发环境 远程持久工作区

安全加固要点(Docker 后端):根文件系统只读、丢弃全部 Linux capabilities、禁止提权、256 进程 PID 上限、命名空间隔离;默认资源 1 CPU / 5GB 内存 / 50GB 磁盘,container_persistent: true 可跨会话保留已装包。

网关生产部署:v0.18.0 网关支持 scale-to-zero(空闲休眠、按需唤醒)和 drain 协调(重启/迁移前平滑排空,不掉线上对话),团队级或托管式 Hermes 服务由此具备生产可用性。配合内置 cron 调度器,可用自然语言配置"每天早 8 点向 Telegram 推送日报、每周日夜间备份"等无人值守自动化。

常见问题

Q:Hermes Agent 和 OpenClaw 是什么关系?
两者是同类的开源个人 AI Agent,Hermes 由 Nous Research 开发,提供官方迁移命令 hermes claw migrate,可自动导入 OpenClaw 的 SOUL.md 人格文件、记忆、技能、命令白名单和 API 密钥。技能生态上两者都兼容 clawhub 等技能源。

Q:记忆写满了报错怎么办?
这是设计行为:Hermes 的记忆从不自动压缩,超限写入会返回错误并列出当前条目,Agent 应在同一回合内合并或删除旧条目后重试。人工治理建议:用量超 80% 时主动合并,用 /journey 可视化检查并删除过时条目。

Q:MoA 会不会很贵?
会显著增加成本——每次调用要跑多个参考模型加一个聚合模型。建议仅在高价值问题上用 /moa 一次性调用,日常保持单模型;后台自我改进循环则相反,应配置 auxiliary.background_review 路由到便宜模型,官方数据可省 3-5 倍。

Q:生产环境部署 Hermes 最重要的三个配置是什么?
一是终端后端改为 sshdocker(官方明确标注 SSH 模式下 Agent 无法修改自身代码);二是开启 skills.write_approvalmemory.write_approval 双审批;三是网关使用 v0.18.0 的 drain 协调机制做平滑重启。

Q:如何让 Hermes 用国内可访问的模型服务?
Hermes 支持任意 OpenAI 兼容端点作为自定义提供商,hermes model 中配置 base_url 和 API Key 即可接入,无需改代码。

总结

Hermes Agent 的进阶之路可以概括为三步:先用 /learn 和记忆治理把 Agent 从工具变成"越用越懂你"的资产;再用 MoA 委员会和 /goal 完成契约提升关键任务的输出质量与可信度;最后通过 SSH/Docker 后端隔离与网关 scale-to-zero 把它推向生产环境。自我改进能力是 Hermes 区别于其他 Agent 框架的护城河,而审批机制让这种自主性始终处于人类监督之下。

据 Nous Research 官方文档(hermes-agent.nousresearch.com)与 GitHub 仓库 v0.18.0 发布说明(2026 年 7 月 1 日)显示,本文所有命令与配置均来自官方一手来源。本文内容基于 2026 年 7 月 2 日数据,Hermes 迭代速度极快(单版本周期 998 个 PR),建议以官方文档为最终依据。


延伸资源

  • Hermes Agent 官方文档:hermes-agent.nousresearch.com/docs
  • GitHub 仓库:github.com/NousResearch/hermes-agent
  • 技能开放标准:agentskills.io
  • 技能共享平台 LinSkills:linskills.qiniu.com
相关文章
|
6天前
|
人工智能 JSON 自然语言处理
让教学更智慧:用阿里云百炼工作流,自动生成中小学教材内容#小有可为#有温度的AI
通过可视化工作流编排,将大模型推理能力转化为标准化的教学内容生成引擎。教师只需输入教材标题和适用学段,即可自动获得结构完整、符合课程标准的章节内容,大幅降低备课门槛,助力教育资源均衡化。
470 123
|
8天前
|
人工智能 定位技术 SEO
我学 GEO 第 15 天:终于知道AI GEO该如何做?
我是暴走的莉莉酱,边旅行边研究AI GEO的数字游民。专注普通人如何提升“AI可见度”——让AI在回答用户问题时准确识别、理解并推荐你。不讲玄学,只做可测、可调、可持续的GEO实践。
450 127
|
16天前
|
Linux 程序员 数据格式
【2026最新】Notepad++下载、安装和使用一篇搞定(附中文版安装包)
Notepad++ 是一款免费开源、轻量高效的 Windows 文本编辑器,支持 C/Python/HTML 等 80+ 语言语法高亮、代码折叠、正则替换、编码转换及插件扩展,专为程序员与文本处理用户打造,完美替代系统记事本。(239字)
|
11天前
|
机器学习/深度学习 人工智能 调度
🐴 HappyHorse 1.1 现已上线阿里云百炼!快来查收模型使用指南,现在调用享 6 折~
HappyHorse 1.1 是新一代视频生成大模型,全面升级动态表现力、角色一致性、指令遵循、视觉质感与音画协同能力。支持I2V/T2V/R2V三类生成,适配短剧、电商广告、品牌营销等场景,提供高质、流畅、可控的AI视频生产力。
773 5
🐴 HappyHorse 1.1 现已上线阿里云百炼!快来查收模型使用指南,现在调用享 6 折~
|
2天前
|
人工智能 安全 Cloud Native
Higress 新发布:AI Gateway 能力增强,Gateway API 及其推理扩展持续打磨
增强 AI 网关能力,持续打磨 Gateway API 及其推理扩展。
291 123
|
2天前
|
消息中间件 存储 Kafka
Kafka 原生消息入湖能力上线!一键打通实时流与数据湖
阿里云消息队列 Kafka 版正式上线原生消息入湖能力。
239 122
|
8天前
|
缓存 人工智能 运维
阿里云618百炼大模型Qwen3.7-Max功能、免费试用、订阅计费、配置接入详解
Qwen3.7-MAX是阿里云百炼平台推出的通义千问3.7系列旗舰大语言模型,专为智能体时代复杂任务打造,依托阿里云全域算力与自研技术,在逻辑推理、长文本处理、代码工程、长周期自主执行等领域达到行业顶尖水平。2026年618期间,该模型推出多重免费试用权益、按量计费5折、订阅套餐优惠等专属福利,覆盖个人开发者、团队与企业全场景需求,以下从核心功能、免费试用、订阅计费、配置接入四方面展开详细解析。
460 124

热门文章

最新文章