别再让 AI 只会聊天了!Hermes Agent 自带 47 个实用工具,一键解锁智能体真正实力

简介: Hermes Agent 内置 47 个实用工具,覆盖网络搜索、终端执行、浏览器自动化、AI 绘图等 8 大类别,可一键启用工具集。本文带你全面掌握智能体工具使用,释放 AI 全能力。

Hermes Agent 工具使用教程

你是否曾经对着 AI 智能体说"帮我查个资料",结果它只能干聊,既不能上网搜索,也不能帮你执行命令、操作文件?Hermes Agent 内置强大工具系统,将网络搜索、终端执行、浏览器自动化、媒体生成等能力封装为可调用工具与工具集。本文从工具概览、启用方式、核心工具实操、终端后端配置、工具网关集成及安全管理六方面,带你全面掌握工具使用,释放智能体全能力。

一、工具与工具集概览

Hermes 工具按功能划分为 8 大核心类别、47 个独立工具,并聚合为可一键启用的 工具集(Toolsets),兼顾灵活性与易用性。

1.1 核心工具类别

类别 核心工具 功能说明
🌐 网络工具 web_searchweb_extract 全网搜索、网页正文提取(支持 Markdown 输出)
💻 终端与文件 terminalread_filepatch 命令执行、文件读写、代码补丁编辑
🧭 浏览器 browser_navigatebrowser_vision 无头浏览器控制、页面视觉分析
🎨 媒体工具 image_generatetext_to_speech AI 绘图、文本转语音(支持多模型)
🧠 智能体编排 tododelegate_task 任务管理、子任务并行委托
📜 记忆工具 memorysession_search 持久记忆读写、历史会话全文检索
⏰ 自动化 cronjobsend_message 定时任务、跨平台消息推送
🔗 集成工具 mcp_*ha_* MCP 外部工具、Home Assistant 智能家居控制

图1:Hermes Agent 工具系统总览

flowchart LR
    A[Hermes 工具系统] --> B[网络工具<br/>搜索与网页提取]
    A --> C[终端与文件<br/>命令执行与读写]
    A --> D[浏览器<br/>导航与视觉分析]
    A --> E[媒体工具<br/>绘图与语音]
    A --> F[智能体编排<br/>任务与委托]
    A --> G[记忆工具<br/>持久记忆与检索]
    A --> H[自动化<br/>定时与推送]
    A --> I[集成工具<br/>MCP与智能家居]

1.2 工具集(一键启用)

工具集是功能聚合包,无需逐个启用,常用预设:

  • web:网络搜索 + 网页提取

  • terminal:终端命令执行

  • file:文件读写与编辑

  • browser:浏览器自动化全套

  • memory:持久记忆与会话搜索

二、工具启用与管理

2.1 命令行临时启用

启动对话时通过 --toolsets 指定工具集,临时生效:

hermes chat --toolsets "web,terminal"

hermes chat --toolsets "web,terminal,file,browser,memory"

hermes chat --toolsets ""

2.2 交互式配置(永久生效)

通过 hermes tools 进入交互式面板,按需启用 / 禁用:

hermes tools

2.3 配置文件设置

编辑 ~/.hermes/config.yaml,默认工具集:

toolsets:
  - web
  - terminal
  - file
  - memory

三、核心工具实操指南

3.1 网络工具(web_search/web_extract)

场景:查资料、爬取文档、实时信息获取

帮我搜索2026年大模型发展趋势,总结3个核心方向

提取https://example.com/ai-report的正文,输出Markdown格式

3.2 终端工具(terminal)

场景:系统操作、代码编译、命令行任务

帮我查看当前磁盘占用,列出最大5个目录

在桌面创建test目录,生成5个Markdown笔记文件

编译当前目录下的Go项目,输出编译日志

3.3 文件工具(read_file/patch)

场景:代码编辑、文档修改、配置更新

读取~/projects/config.yaml,高亮关键配置

给main.py添加日志模块,保留原有逻辑

3.4 媒体工具(image_generate/tts)

场景:AI 绘图、语音合成

生成一张科技风AI助手海报,蓝色主调,高清

把“Hermes工具使用教程”转为中文女声语音

3.5 记忆工具(memory/session_search)

场景:跨会话记忆、历史内容检索

记住:Hermes支持200+模型,可一键切换国产/海外模型

搜索之前讨论的“大模型部署方案”相关内容

四、终端后端配置(执行环境)

终端工具支持 7 种执行后端,决定命令运行位置,兼顾安全与灵活性。

4.1 后端类型与适用场景

后端 说明 适用场景
local(默认) 本机直接执行 开发、可信任务
docker 隔离容器执行 安全沙箱、环境隔离
ssh 远程服务器执行 远程运维、高性能计算
modal 无服务器云 弹性扩展、临时任务

图2:终端后端选型决策流程

flowchart TD
    A[选择终端后端] --> B{需要隔离执行?}
    B -->|是| C{需要远程执行?}
    B -->|否| D[local 本地执行]
    C -->|是| E{有固定服务器?}
    C -->|否| F[Docker 沙箱]
    D --> G[适合:开发/可信任务]
    E -->|是| H[SSH 远程执行]
    E -->|否| I[Modal 无服务器]
    F --> J[适合:安全沙箱/环境隔离]
    H --> K[适合:远程运维/高性能]
    I --> L[适合:弹性扩展/临时任务]

4.2 配置方式

(1)命令行设置

hermes config set terminal.backend docker

(2)配置文件(config.yaml)

terminal:
  backend: docker  # 或 local/ssh/modal
  timeout: 300     # 命令超时(秒)
  docker_image: python:3.11-slim
  docker_volumes:  # 挂载本地目录
    - "~/projects:/workspace"

4.3 Docker 后端(安全推荐)

容器运行在 安全强化模式

  • 只读根文件系统、无权限提升

  • PID 限制(最多 256 进程)

  • 完全命名空间隔离,避免宿主机污染

五、Nous 工具网关(订阅集成)

Nous 工具网关是付费订阅专属能力,无需单独注册 API 密钥,一键启用网络搜索、图像生成、TTS、浏览器自动化。

5.1 网关包含能力

工具 替代独立密钥
网络搜索 / 提取 FIRECRAWL_API_KEY
图像生成 FAL_KEY
文本转语音 OPENAI_TTS_KEY
浏览器自动化 BROWSER_USE_API_KEY

5.2 启用方式

(1)模型配置时启用

运行 hermes model 选择 Nous Portal,自动提示启用网关:

选择启用Nous Tool Gateway → 勾选工具 → 完成配置

(2)手动配置

编辑 config.yaml,启用网关:

web:
  use_gateway: true  # 网络工具走网关
image_gen:
  use_gateway: true  # 图像生成走网关

5.3 网关优先级

  • use_gateway: true:强制走网关,忽略本地密钥

  • use_gateway: false:优先本地密钥,无密钥时回退网关

六、工具安全与权限管理

6.1 风险操作确认

高风险操作(删除文件、系统修改、网络请求)自动触发确认

帮我删除~/temp目录
→ 系统提示:确认删除?(输入y确认)

6.2 安全配置(config.yaml)

security:
  credential_redaction: true
  website_blocklist:
    enabled: true
    domains: ["*.torrent", "192.168.0.0/16"]

6.3 容器安全(Docker 后端)

  • 只读根文件系统、禁用权限提升

  • 进程数量限制、资源隔离

七、常见问题排查

  1. 工具调用失败(无权限)

    • 本地执行:确认文件 / 命令权限

    • Docker 后端:检查容器挂载目录权限

  2. 网关工具不可用

    • 确认 Nous 订阅有效:hermes status

    • 重新启用网关:hermes tools → 勾选网关工具

  3. 终端命令超时

    • 延长超时时间:hermes config set terminal.timeout 600
  4. 浏览器工具打不开页面

    • 检查网络代理:关闭代理 / VPN

    • 确认浏览器镜像正常:docker images | grep browser

八、总结

Hermes 工具系统以 分类清晰、灵活可控、安全隔离 为核心,覆盖从日常操作到复杂自动化的全场景需求。新手可通过 --toolsets 快速启用常用组合,进阶用户可配置 Docker 沙箱、集成 Nous 网关或自定义 MCP 工具。掌握工具使用,才能充分释放 Hermes 自进化能力,打造全能 AI 助手。

目录
相关文章
|
15天前
|
人工智能 自然语言处理 文字识别
阿里云百炼Qwen3.7-Max简介:能力、优势、支持订阅计划参考
Qwen3.7-Max是阿里云百炼面向智能体时代推出的新一代旗舰模型,对标GPT-5.5、Claude Opus 4.7等闭源旗舰。该模型支持百万级token上下文窗口,具备顶级推理能力、多模态搜索与视觉理解增强、流式输出低延迟响应等核心优势,覆盖编程、办公、长周期自主执行等复杂场景。同时支持OpenAI接口兼容,便于系统快速迁移。用户可通过Token Plan团队或节省计划等订阅方式灵活调用,适合企业级高要求场景使用。
5761 29
阿里云百炼Qwen3.7-Max简介:能力、优势、支持订阅计划参考
|
10天前
|
存储 定位技术 数据库
CodeGraph 如何让 Claude Code减少 7 成工具调用?
CodeGraph 为 Coding Agent 提供本地代码知识图谱,把函数、类、调用链和框架路由提前整理成“项目地图”,减少盲目搜索和文件读取。它不是新 Agent,而是上下文基础设施,让 Agent 更快找到正确代码路径,平均减少 7 成工具调用。
1168 2
|
7天前
|
人工智能 安全 定位技术
CodeGraph深度解析 让Claude Code工具调用直降七成的核心原理与实操教程
如今以Claude Code为代表的AI编程智能体已经成为开发者日常编码、项目重构、漏洞修复的必备工具。但在长期使用过程中,几乎所有开发者都会遇到同一个明显痛点:AI虽然具备强大的代码生成与分析能力,却常常陷入盲目探索的循环中。
940 1
|
17天前
|
人工智能 自然语言处理 供应链
|
8天前
|
人工智能 弹性计算 安全
阿里云618活动时间、活动入口、优惠活动详细解读
2026年阿里云618创新加速季已全面开启,作为年度力度最大的云产品促销活动,本次大促覆盖轻量应用服务器、ECS云服务器、GPU云服务器、数据库、AI算力、安全服务、CDN等全品类产品,推出5亿元算力补贴、新用户限时秒杀、普惠满减、企业专享、免费试用、云大使返佣等多重福利,个人开发者、中小企业、AI团队均可享受专属低价。本文将系统梳理2026年阿里云618活动的完整时间节点、官方参与入口、各类优惠细则、使用规则、热门产品推荐及实操代码,帮助用户精准参与、高效省钱,以最低成本完成上云部署。
714 4
|
23天前
|
人工智能 开发工具 iOS开发
Claude Code 新手完全上手指南:安装、国产模型配置与常用命令全解
Claude Code 是一款运行在终端环境中的 AI 编程助手,能够直接在命令行中完成代码生成、项目分析、文件修改、命令执行、Git 管理等开发全流程工作。它最大的特点是**任务驱动、终端原生、轻量高效、多模型兼容**,无需图形界面、不依赖 IDE 插件,能够深度融入开发者日常工作流。
3831 15
|
8天前
|
运维
欢迎报名|2026 Agentic AICon—智能体基础设施与AgentOps专场,邀您参会
欢迎报名|2026 Agentic AICon—智能体基础设施与AgentOps专场,邀您参会
1424 0

热门文章

最新文章