阿里云2026保姆级教程:Hermes Agent与OpenClaw部署及Token Plan配置完整步骤

简介: 2026年,Hermes Agent与OpenClaw是两款应用广泛的本地自治AI智能体框架,能够自主完成代码编写、文档处理、多步骤任务自动化、工具调用等复杂工作。依托阿里云服务器算力,搭配百炼Token Plan统一积分计费体系,可以实现稳定、低成本、可规模化的智能体长期运行。

一、整体方案概述

2026年,Hermes Agent与OpenClaw是两款应用广泛的本地自治AI智能体框架,能够自主完成代码编写、文档处理、多步骤任务自动化、工具调用等复杂工作。依托阿里云服务器算力,搭配百炼Token Plan统一积分计费体系,可以实现稳定、低成本、可规模化的智能体长期运行。
整套落地流程分为四大核心阶段:阿里云服务器资源创建、百炼Token Plan开通与密钥获取、Hermes Agent/OpenClaw分别部署、智能体绑定Token Plan完成功能验证。本文为保姆级分步实操教程,覆盖轻量应用服务器、ECS云服务器两种主流部署载体,兼顾零基础新手与有运维基础的开发人员,全程附带完整执行命令、配置参数与故障排查方案。阿里云部署AI Agent:OpenClaw/Hermes Agent全网最简单,只需两步,详情👉访问阿里云OpenClaw/Hermes一键部署专题页面 了解。
OpenClaw1.png
OpenClaw2.png
OpenClaw02.png
openClaw3.png
OpenClaw031.png
OpenClaw03.png
OpenClaw04.png
OpenClaw5.png
Openclaw6.png
Token Plan Token最便宜/支持多模型切换:👉访问订阅阿里云百炼Token Plan AI大模型服务 。支持多模型切换,用于多模态模型灵活调用,实现多模型、多工具、多场景下的额度共享与统一管理,兼顾灵活性、稳定性与安全性,大幅降低企业使用大模型的门槛与成本。
tokenplan1.png
tokenplan1.png
tokenplan2.png
tokenplan3.png
tokenplan4.png

二、部署前置准备工作

2.1 账号与实名认证要求

需要完成阿里云账号注册与实名认证,个人用户可通过实名渠道快速完成,企业用户需提交对应资质材料。如果团队多人协作,建议使用RAM子账号分配权限,仅授予云服务器、百炼平台相关操作权限,遵循最小权限原则,降低账号安全风险。
子账号需提前分配的权限包含云服务器实例管理、安全组编辑、百炼模型调用、API密钥查看等权限,未分配完整权限会出现服务器创建失败、模型调用鉴权报错等问题。

2.2 百炼Token Plan基础说明与开通流程

Token Plan是百炼平台推出的订阅式统一计费服务,以Credits积分作为通用消耗单位,一套积分可通用平台全部大模型,区别于传统按量按Token计费,预算可控,适合智能体长期高频调用场景。

  1. 进入阿里云百炼大模型服务平台,找到Token Plan订阅入口,根据使用规模选择对应档位。个人日常开发可选择标准坐席,团队高频智能体并行运行可选择高级或尊享坐席。
  2. 完成订阅后进入API密钥管理页面,创建Token Plan专属密钥,密钥标识以sk-sp开头,与普通按量付费API Key区分,务必完整复制保存,关闭弹窗后无法二次查看。
  3. 记录Token Plan专属OpenAI兼容接口地址,该地址是Hermes、OpenClaw接入的核心参数,后续配置智能体时必须填写,不可使用普通模型通用地址。

2.3 本地操作工具准备

远程连接工具用于SSH登录阿里云服务器,主流工具均可使用,同时准备文本编辑器,单独存储API密钥、智能体访问凭证等敏感信息,避免明文写在脚本中泄露。
地域选择建议:国内华北2地域网络稳定性强,适合常规业务;海外地域无需备案,公网访问无限制,智能体联网搜索功能不受约束。

三、阿里云服务器创建与基础环境初始化

提供两种主流部署方案,轻量应用服务器适合零基础用户,内置简化流程;ECS云服务器适合需要自定义系统、资源扩容的进阶使用者。

零基础部署AI Agent:OpenClaw/Hermes Agent喂饭级步骤流程

第一步:👉点击打开访问阿里云OpenClaw/Hermes Agent一键部署专题页面
OpenClaw1.png
OpenClaw2.png
OpenClaw02.png
openClaw3.png
OpenClaw031.png
OpenClaw03.png
OpenClaw04.png
OpenClaw5.png
Openclaw6.png

👉访问订阅阿里云百炼Token Plan AI大模型服务 。支持多模型切换,用于多模态模型灵活调用,实现多模型、多工具、多场景下的额度共享与统一管理,兼顾灵活性、稳定性与安全性,大幅降低企业使用大模型的门槛与成本。
tokenplan1.png
tokenplan1.png
tokenplan2.png
tokenplan3.png
tokenplan4.png

第二步:👉打开选择阿里云轻量应用服务器,配置参考如下:

  • 镜像:OpenClaw(或Hermes Agent)镜像(已经购买服务器的用户可以重置系统重新选择镜像)
  • 实例:内存必须2GiB及以上。
  • 地域:默认美国(弗吉尼亚),目前中国内地域(除香港)的轻量应用服务器,联网搜索功能受限。
  • 时长:根据自己的需求及预算选择。

轻量应用服务器OpenClaw镜像.png
bailian1.png
bailian2.png

第三步:打开访问阿里云百炼大模型控制台,找到密钥管理,单击创建API-Key。

阿里云百炼密钥管理图.png

前往轻量应用服务器控制台,找到安装好OpenClaw的实例,进入「应用详情」放行18789端口、配置百炼API-Key、执行命令,生成访问OpenClaw的Token。
阿里云百炼密钥管理图2.png

  • 端口放通:需要放通对应端口的防火墙,单击一键放通即可。
  • 配置百炼API-Key,单击一键配置,输入百炼的API-Key。单击执行命令,写入API-Key。
  • 配置OpenClaw/Hermes:单击执行命令,生成访问OpenClaw/Hermes的Token。
  • 访问控制页面:单击打开网站页面可进入OpenClaw/Hermes对话页面。

阿里云百炼Coding Plan API-Key 获取、配置保姆级教程:

创建API-Key,推荐访问订阅阿里云百炼Coding Plan,阿里云百炼Coding Plan每天两场抢购活动,从按tokens计费升级为按次收费,可以进一步节省费用!
CodingPlan.png

  • 购买后,在控制台生成API Key。注:这里复制并保存好你的API Key,后面要用。
    image.png
  • 回到轻量应用服务器-控制台,单击服务器卡片中的实例 ID,进入服务器概览页。
    image.png
  • 在服务器概览页面单击应用详情页签,进入服务器详情页面。
    image.png
  • 端口放通在OpenClaw使用步骤区域中,单击端口放通下的执行命令,可开放获取OpenClaw 服务运行端口的防火墙。
    image.png
  • 这里系统会列出我们第一步中创建的阿里云百炼 Coding Plan的API Key,直接选择就可以。
    image.png
  • 获取访问地址单击访问 Web UI 面板下的执行命令,获取 OpenClaw WebUI 的地址。
    image.png
    image.png

    3.1 方案一:轻量应用服务器(新手首选)

  1. 进入轻量应用服务器控制台,点击创建实例,镜像分类选择应用镜像,内置Hermes Agent预装镜像,无需手动下载依赖环境。
  2. 实例资源规格选择:最低2核2G内存,若需要同时运行Hermes与OpenClaw双智能体,建议升级至4核4G内存,系统盘默认40G以上高效云盘,带宽选择5M及以上保障公网访问流畅。
  3. 设置登录密码,选择订阅时长,确认配置后提交创建,等待数分钟实例状态变更为运行中。
  4. 端口放行操作:进入实例应用详情页面,一键放行22端口(SSH远程连接)与18789端口(智能体Web可视化页面访问端口)。测试阶段可开放全部公网访问,正式投入使用后修改白名单,仅允许固定IP接入,提升安全防护。

3.2 方案二:ECS云服务器(自定义进阶部署)

  1. 进入ECS控制台创建实例,操作系统可选Alibaba Cloud Linux 3或者Ubuntu 20.04及以上版本,专有网络模式,开启公网IP,设置登录密码或密钥对。
  2. 实例规格配置基础要求2核2G,多智能体并行推荐4核8G及以上,系统盘选用ESSD云盘,容量不低于40G。
  3. 安全组规则新增放行TCP 22、18789端口,临时来源设置为0.0.0.0/0,生产环境限制指定IP段。
  4. 使用SSH工具连接服务器,执行系统更新与基础依赖安装命令:
    Ubuntu系统:
    sudo apt update && sudo apt upgrade -y
    sudo apt install python3 python3-pip git docker.io nodejs -y
    
    Alibaba Cloud Linux系统:
    sudo yum update -y
    sudo yum install python3 python3-pip git docker nodejs -y
    

3.3 服务器通用基础优化

  1. 时区校准,统一服务器时区,避免日志、任务执行时间错乱;
  2. 关闭不必要系统自带服务,释放内存与CPU资源,保障智能体运行算力;
  3. 配置磁盘自动扩容,防止长期运行日志、缓存占用磁盘空间导致服务崩溃。

四、Hermes Agent完整部署与Token Plan绑定配置

4.1 Hermes一键安装脚本执行

SSH登录服务器终端,执行官方一键安装脚本,自动拉取程序、配置运行环境:

curl -fsSL https://hermes.ai/install.sh | bash

安装完成后输入版本查看命令,校验安装是否成功:

hermes -v

输出版本号即代表安装无异常,若提示命令不存在,重新执行安装脚本或检查网络连通性。

4.2 命令行绑定百炼Token Plan参数

逐条执行配置指令,替换为自身获取的Token Plan专属API Key与接口地址:

hermes config set model.provider custom
hermes config set model.base_url https://token-plan.cn-beijing.maas.aliyuncs.com/compatible-mode/v1
hermes config set model.api_mode openai_messages
hermes config set model.api_key sk-sp-替换为自己的密钥
hermes config set model.default qwen3.7-plus
hermes config set gateway.port 18789

参数说明:默认模型优先选择Qwen3.7 Plus,兼顾文本推理与多模态能力;仅纯文本超长文档处理场景可修改为qwen3.7-max。

4.3 启动服务并生成Web访问凭证

配置完成后启动Hermes后台服务:

hermes run

新开终端窗口生成管理员访问Token,用于浏览器登录可视化后台:

hermes token generate

复制生成的长串字符妥善保存,无该凭证无法访问智能体管理页面。

4.4 手动配置文件精细化调整(高级自定义)

如需调整模型随机度、单次最大输出长度等参数,直接编辑本地配置文件,文件路径为~/.hermes/config.yaml,修改完成后重启服务生效:

hermes restart

支持自定义temperature数值,严谨公文、数据分析场景设置0.2,创意内容生成场景设置0.7;max_tokens根据业务需求调整上限。

4.5 Hermes开机自启配置

为避免服务器重启后智能体服务中断,配置开机自动运行脚本:

sudo vim /etc/rc.local

文件末尾新增执行指令:

cd /root/.hermes
nohup hermes run > hermes_log.log 2>&1 &

保存退出后赋予文件执行权限:

sudo chmod +x /etc/rc.local

重启服务器测试自启效果,重启后无需手动执行hermes run即可正常访问Web页面。

五、OpenClaw完整部署与Token Plan绑定配置

OpenClaw采用容器化部署方式,依赖Docker环境,轻量服务器预装镜像可跳过Docker安装步骤,ECS手动部署需确认Docker服务正常运行。

5.1 容器拉取与启动基础容器

拉取OpenClaw核心镜像并启动容器实例:

docker pull openclaw/core
docker run -d --name openclaw-core -p 18789:18789 openclaw/core

进入容器内部执行配置操作:

docker exec -it openclaw-core /bin/bash

5.2 容器内配置Token Plan相关参数

依次执行配置命令,填入专属密钥与接口地址:

openclaw config set models.providers.bailian-token.apiKey "sk-sp-替换为自身密钥"
openclaw config set models.providers.bailian-token.baseUrl "https://token-plan.cn-beijing.maas.aliyuncs.com/compatible-mode/v1"
openclaw config set agents.defaults.model.primary "bailian-token/qwen3.7-plus"
openclaw config set models.providers.bailian-token.token_plan_enabled true

开启token_plan_enabled参数是关键,若该参数为false,调用模型时不会抵扣Credits积分,自动切换为按量付费模式,产生额外开销。

5.3 重启服务并生成管理员访问凭证

配置完成后重启网关服务加载新参数:

openclaw gateway restart

生成Web后台登录Token:

openclaw token generate --admin

将生成的访问凭证保存,用于浏览器登录OpenClaw管理界面,可查看任务队列、工具调用记录、模型消耗统计。

5.4 OpenClaw容器开机自启设置

配置Docker容器随服务器开机自动启动:

docker update --restart always openclaw-core

重启服务器验证,重启后容器自动运行,无需手动执行docker run指令。

六、智能体功能验证与Token Plan额度消耗校验

6.1 Web可视化页面访问测试

浏览器输入地址格式 http://服务器公网IP:18789,输入生成的访问Token完成登录,分别进入Hermes、OpenClaw后台页面。
登录成功后可查看模型选择列表、技能开关、任务执行日志、用量统计面板。

6.2 基础对话与工具调用验证

  1. 简单文本测试指令,输入“简要介绍百炼Token Plan计费模式”,观察模型是否正常返回回答,无报错、无超时代表接口连通正常。
  2. 工具调用测试指令,输入“编写一段两数求和Python脚本并执行”,智能体自动生成代码、运行并返回结果,代表工具调用链路完整。
  3. 多模态测试(仅Qwen3.7 Plus支持),上传本地图片,下达分析指令,图片可正常解析代表多模态配置无异常。

6.3 Token Plan积分消耗校验

登录阿里云百炼平台,进入Token Plan用量统计页面,查看Credits实时扣除记录。正常情况下,智能体每一次模型调用都会从套餐积分中抵扣,不会产生按量付费账单。
若未产生积分消耗记录,排查三点:API Key是否为sk-sp开头专属密钥、base_url是否填写Token Plan专属地址、智能体配置内token_plan_enabled是否开启。

七、智能体优化配置与安全管控方案

7.1 技能扩展配置

Hermes与OpenClaw均内置文件处理、代码执行、联网检索、数据查询通用技能,在Web后台技能管理面板一键启用。所有技能调用模型统一消耗Token Plan积分,无需额外单独配置计费。
可自定义专属工作流技能,将重复业务流程固化,一键调用,减少重复指令输入。

7.2 性能优化手段

  1. 模型分层调度:简单问答、文本过滤使用Qwen3.7 Flash降低积分消耗;图文、自动化任务使用Plus;超长复杂逻辑推理临时切换Max;
  2. 精简上下文记忆长度,自动清理无用历史对话,减少单次输入Token数量;
  3. 批量文件处理启用批量推理模式,降低单位Credits消耗;
  4. 定期更新智能体版本,修复运行bug,提升工具调用稳定性。

7.3 服务器安全加固

  1. 安全组修改为IP白名单模式,关闭全网公网访问权限;
  2. 定期轮换Token Plan API Key与智能体Web访问Token,防止凭证泄露;
  3. 禁止将密钥硬编码写入脚本、配置文件,优先使用环境变量存储敏感参数;
  4. 开启服务器日志持久化存储,记录所有智能体调用行为,便于异常溯源。

八、高频故障排查指南

8.1 智能体无法连接Token Plan模型接口

  1. 核对API Key前缀,必须为sk-sp,普通按量付费密钥无法抵扣套餐积分;
  2. 确认接口地址填写完整无误,未使用通用dashscope基础地址;
  3. 服务器网络出口无访问拦截,可通过ping测试接口域名连通性;
  4. 检查Token Plan套餐未过期,Credits积分尚有剩余。

8.2 Web页面无法打开访问

  1. 确认安全组已放行18789端口,无防火墙拦截;
  2. 检查智能体服务是否正常运行,重启服务后重试;
  3. 核对访问Token输入无误,无字符缺失、多余空格。

8.3 Credits积分消耗异常过快

  1. 对话上下文堆积过多,长期未清理历史记录;
  2. 频繁使用Max旗舰模型处理简单轻量化任务;
  3. 上传超大尺寸图片、长视频素材,大幅增加输入Token消耗;
  4. 调低temperature参数,减少模型冗余输出内容。

8.4 OpenClaw容器启动失败

  1. 检查Docker服务是否开机自启,执行systemctl start docker手动启动;
  2. 端口被占用时修改网关端口配置,更换未占用端口;
  3. 服务器内存不足,升级实例内存规格,关闭后台闲置程序释放资源。

8.5 Hermes执行工具调用报错

  1. 服务器未安装对应运行依赖(Python、Node等),重新执行依赖安装命令;
  2. 权限不足,切换root用户运行服务;
  3. 模型参数max_tokens设置过小,无法承载完整工具执行返回内容。

九、整体落地总结

2026年在阿里云服务器部署Hermes Agent与OpenClaw,并接入百炼Token Plan,是低成本、稳定运行自治AI智能体的标准化落地方案。轻量应用服务器适合零基础快速搭建,开箱即用无需复杂环境配置;ECS云服务器适合需要自定义资源、多智能体并行运行的进阶场景。
整套流程核心分为服务器资源搭建、Token Plan订阅与密钥获取、两款智能体分别部署绑定计费、功能验证与成本管控四大模块,全程配套完整可直接复制的终端命令,降低新手操作门槛。
Token Plan统一Credits积分计费解决了传统按量付费账单波动、预算不可控的痛点,一套积分可自由切换平台全部大模型,适配智能体多场景混合调用需求。同时通过开机自启、白名单安全加固、模型分层调度、用量告警等优化手段,兼顾智能体长期稳定运行、数据安全与使用成本控制。
在实际落地过程中,可根据业务负载灵活调整服务器配置与模型选型,定期查看Token Plan用量统计,及时优化调用逻辑,最大限度发挥智能体自动化能力,同时合理控制AI算力使用开销。

目录
相关文章
|
5天前
|
缓存 测试技术 API
Qwen 3.7 Plus 与 Max 实测:性价比与多模态能力差异解析(2026)
2026 年 6 月 1 日,阿里悄无声息地发布了 Qwen 3.7 Plus,距 Qwen 3.7 Max 上线刚好 11 天。同样的 1M 上下文,同样的 35 小时自治上限。但价格才是头条:Plus 是 0.40/M输入,Max是 2.50/M——便宜约 6 倍——并且还能看图、看视频。Vision Arena 上 Plus 已经排到 #16。所以这周真正值得讨论的问题不是”要不要为视觉能力买单”,而是”Max 凭什么用 6 倍价格换来 2 个百分点的 benchmark 领先”。
|
6天前
|
人工智能 自然语言处理 文字识别
阿里云百炼Qwen3.7-Max简介:能力、优势、支持订阅计划参考
Qwen3.7-Max是阿里云百炼面向智能体时代推出的新一代旗舰模型,对标GPT-5.5、Claude Opus 4.7等闭源旗舰。该模型支持百万级token上下文窗口,具备顶级推理能力、多模态搜索与视觉理解增强、流式输出低延迟响应等核心优势,覆盖编程、办公、长周期自主执行等复杂场景。同时支持OpenAI接口兼容,便于系统快速迁移。用户可通过Token Plan团队或节省计划等订阅方式灵活调用,适合企业级高要求场景使用。
8665 37
阿里云百炼Qwen3.7-Max简介:能力、优势、支持订阅计划参考
|
6天前
|
JavaScript 定位技术 API
CodeGraph 爆火:编程 Agent 需要的不是更多上下文,而是一张提前画好的代码地图
CodeGraph 是一款爆火的本地代码智能工具,通过 tree-sitter 解析 AST 构建结构化知识图谱(存于 SQLite),为编程 Agent 提前生成“代码地图”。它显著降低 Agent 在中大型项目中的探索成本——实测工具调用减少71%、Token 降57%、速度提升46%,支持19+语言及主流框架路由识别,完全离线、无需 API Key。
668 5
CodeGraph 爆火:编程 Agent 需要的不是更多上下文,而是一张提前画好的代码地图
|
6天前
|
人工智能 运维 JavaScript
阿里云Qoder CN(原通义灵码)全解析 产品形态、版本划分与技术适配说明
在AI辅助开发与智能办公工具持续普及的当下,阿里云旗下原通义灵码正式更名为Qoder CN,同时延伸出QoderWork CN、Qoder CN CLI、Qoder CN Mobile等多款配套产品,形成覆盖代码开发、日常办公、终端交互、移动端使用的完整工具矩阵。Qoder CN核心定位为AI智能编码助手,深度适配主流代码编辑器、集成开发环境以及终端场景;QoderWork CN则偏向桌面端综合办公辅助,二者面向不同使用场景,划分了多个版本档位,搭配差异化资源配额、功能权限与计费规则,同时兼容多款主流大模型。
668 5
|
6天前
|
数据采集 人工智能 前端开发
让 Coding Agent 从黑盒到透明:阿里云 Agent 观测审计数据采集实践
AI Agent 规模化落地带来执行黑盒、行为难追溯、成本难度量三大难题。阿里云基于 OTel 标准,面向 Coding Agent、个人通用助理和框架型 Agent,推出 LoongSuite Pilot、插件及探针等无侵入采集方案,让 Agent 实现可看见、可分析、可审计、可治理。
730 148
|
6天前
|
存储 安全 Java
AgentScope Java 2.0:打造分布式、企业级智能体底座
AgentScope 2.0 面向分布式部署、稳定运行、权限安全等企业级需求全面升级,打造支持多租户隔离与长期稳定运行的企业级智能体底座。
|
6天前
|
人工智能 运维 自然语言处理
阿里云百炼Qwen3.7-Max模型详解:综合能力、核心优势与订阅计划参考指南
2026年,大模型技术持续向通用化、高性能、场景化方向迭代,阿里云百炼作为一站式大模型服务平台,持续推出迭代升级的模型产品,Qwen3.7-Max便是当前主力旗舰级大模型之一。该模型依托深度优化的底层架构与大规模训练数据,在文本理解、逻辑推理、多模态交互、代码生成、长文本处理等多个维度实现能力升级,同时搭配灵活的订阅计划体系,能够适配个人开发者、中小企业、大型企业、政企机构等不同类型用户的使用需求。
572 2
|
6天前
|
人工智能 缓存 自然语言处理
阿里Qwen3.7-Max评测:Agent能力显著提升,耗时与调用成本大幅下降
阿里云百炼推出面向智能体的旗舰大模型Qwen3.7-Max,具备长周期自主执行能力,显著提升编程、办公自动化等复杂任务处理水平;支持MCP集成与多框架兼容,并以限时5折+100万Tokens免费试用大幅降低使用门槛,助力企业高效落地AI应用。在阿里云百炼平台快速体验:https://t.aliyun.com/U/fPVHqY
1964 10
|
6天前
|
JSON 缓存 安全
通过 CC Switch 本地路由让 Codex CLI 接入 DeepSeek 等第三方模型
CC Switch 通过本地路由(`127.0.0.1:15721`)实现协议转换:将 Codex 的 Responses API 请求自动映射为 DeepSeek 等厂商的 Chat Completions 接口,兼容流式响应与工具调用,无需修改 Codex 源码,安全隔离 API Key。(239字)
1678 3
通过 CC Switch 本地路由让 Codex CLI 接入 DeepSeek 等第三方模型
|
6天前
|
人工智能 运维 API
2026年阿里云百炼通义千问Qwen3.7-plus深度介绍 功能特性、使用优势及618大促订阅方案指南
大模型技术的普及,让AI能力逐步融入个人办公、内容创作、代码编写、企业运营、教育培训等各类场景。不同定位的模型对应不同使用需求,旗舰级模型性能强劲但使用成本偏高,轻量化模型价格低廉却难以胜任复杂任务,而介于两者之间的中端主力模型,凭借均衡的能力、亲民的定价、广泛的场景适配性,成为绝大多数个人用户、小型团队、中小企业的首选。
777 1