一、整体方案概述
2026年,Hermes Agent与OpenClaw是两款应用广泛的本地自治AI智能体框架,能够自主完成代码编写、文档处理、多步骤任务自动化、工具调用等复杂工作。依托阿里云服务器算力,搭配百炼Token Plan统一积分计费体系,可以实现稳定、低成本、可规模化的智能体长期运行。
整套落地流程分为四大核心阶段:阿里云服务器资源创建、百炼Token Plan开通与密钥获取、Hermes Agent/OpenClaw分别部署、智能体绑定Token Plan完成功能验证。本文为保姆级分步实操教程,覆盖轻量应用服务器、ECS云服务器两种主流部署载体,兼顾零基础新手与有运维基础的开发人员,全程附带完整执行命令、配置参数与故障排查方案。阿里云部署AI Agent:OpenClaw/Hermes Agent全网最简单,只需两步,详情👉访问阿里云OpenClaw/Hermes一键部署专题页面 了解。








Token Plan Token最便宜/支持多模型切换:👉访问订阅阿里云百炼Token Plan AI大模型服务 。支持多模型切换,用于多模态模型灵活调用,实现多模型、多工具、多场景下的额度共享与统一管理,兼顾灵活性、稳定性与安全性,大幅降低企业使用大模型的门槛与成本。




二、部署前置准备工作
2.1 账号与实名认证要求
需要完成阿里云账号注册与实名认证,个人用户可通过实名渠道快速完成,企业用户需提交对应资质材料。如果团队多人协作,建议使用RAM子账号分配权限,仅授予云服务器、百炼平台相关操作权限,遵循最小权限原则,降低账号安全风险。
子账号需提前分配的权限包含云服务器实例管理、安全组编辑、百炼模型调用、API密钥查看等权限,未分配完整权限会出现服务器创建失败、模型调用鉴权报错等问题。
2.2 百炼Token Plan基础说明与开通流程
Token Plan是百炼平台推出的订阅式统一计费服务,以Credits积分作为通用消耗单位,一套积分可通用平台全部大模型,区别于传统按量按Token计费,预算可控,适合智能体长期高频调用场景。
- 进入阿里云百炼大模型服务平台,找到Token Plan订阅入口,根据使用规模选择对应档位。个人日常开发可选择标准坐席,团队高频智能体并行运行可选择高级或尊享坐席。
- 完成订阅后进入API密钥管理页面,创建Token Plan专属密钥,密钥标识以sk-sp开头,与普通按量付费API Key区分,务必完整复制保存,关闭弹窗后无法二次查看。
- 记录Token Plan专属OpenAI兼容接口地址,该地址是Hermes、OpenClaw接入的核心参数,后续配置智能体时必须填写,不可使用普通模型通用地址。
2.3 本地操作工具准备
远程连接工具用于SSH登录阿里云服务器,主流工具均可使用,同时准备文本编辑器,单独存储API密钥、智能体访问凭证等敏感信息,避免明文写在脚本中泄露。
地域选择建议:国内华北2地域网络稳定性强,适合常规业务;海外地域无需备案,公网访问无限制,智能体联网搜索功能不受约束。
三、阿里云服务器创建与基础环境初始化
提供两种主流部署方案,轻量应用服务器适合零基础用户,内置简化流程;ECS云服务器适合需要自定义系统、资源扩容的进阶使用者。
零基础部署AI Agent:OpenClaw/Hermes Agent喂饭级步骤流程
第一步:👉点击打开访问阿里云OpenClaw/Hermes Agent一键部署专题页面。








👉访问订阅阿里云百炼Token Plan AI大模型服务 。支持多模型切换,用于多模态模型灵活调用,实现多模型、多工具、多场景下的额度共享与统一管理,兼顾灵活性、稳定性与安全性,大幅降低企业使用大模型的门槛与成本。




第二步:👉打开选择阿里云轻量应用服务器,配置参考如下:
- 镜像:OpenClaw(或Hermes Agent)镜像(已经购买服务器的用户可以重置系统重新选择镜像)
- 实例:内存必须2GiB及以上。
- 地域:默认美国(弗吉尼亚),目前中国内地域(除香港)的轻量应用服务器,联网搜索功能受限。
- 时长:根据自己的需求及预算选择。



第三步:打开访问阿里云百炼大模型控制台,找到密钥管理,单击创建API-Key。

前往轻量应用服务器控制台,找到安装好OpenClaw的实例,进入「应用详情」放行18789端口、配置百炼API-Key、执行命令,生成访问OpenClaw的Token。
- 端口放通:需要放通对应端口的防火墙,单击一键放通即可。
- 配置百炼API-Key,单击一键配置,输入百炼的API-Key。单击执行命令,写入API-Key。
- 配置OpenClaw/Hermes:单击执行命令,生成访问OpenClaw/Hermes的Token。
- 访问控制页面:单击打开网站页面可进入OpenClaw/Hermes对话页面。
阿里云百炼Coding Plan API-Key 获取、配置保姆级教程:
创建API-Key,推荐访问订阅阿里云百炼Coding Plan,阿里云百炼Coding Plan每天两场抢购活动,从按tokens计费升级为按次收费,可以进一步节省费用!
- 购买后,在控制台生成API Key。注:这里复制并保存好你的API Key,后面要用。

- 回到轻量应用服务器-控制台,单击服务器卡片中的实例 ID,进入服务器概览页。

- 在服务器概览页面单击应用详情页签,进入服务器详情页面。

- 端口放通在OpenClaw使用步骤区域中,单击端口放通下的执行命令,可开放获取OpenClaw 服务运行端口的防火墙。

- 这里系统会列出我们第一步中创建的阿里云百炼 Coding Plan的API Key,直接选择就可以。

- 获取访问地址单击访问 Web UI 面板下的执行命令,获取 OpenClaw WebUI 的地址。


3.1 方案一:轻量应用服务器(新手首选)
- 进入轻量应用服务器控制台,点击创建实例,镜像分类选择应用镜像,内置Hermes Agent预装镜像,无需手动下载依赖环境。
- 实例资源规格选择:最低2核2G内存,若需要同时运行Hermes与OpenClaw双智能体,建议升级至4核4G内存,系统盘默认40G以上高效云盘,带宽选择5M及以上保障公网访问流畅。
- 设置登录密码,选择订阅时长,确认配置后提交创建,等待数分钟实例状态变更为运行中。
- 端口放行操作:进入实例应用详情页面,一键放行22端口(SSH远程连接)与18789端口(智能体Web可视化页面访问端口)。测试阶段可开放全部公网访问,正式投入使用后修改白名单,仅允许固定IP接入,提升安全防护。
3.2 方案二:ECS云服务器(自定义进阶部署)
- 进入ECS控制台创建实例,操作系统可选Alibaba Cloud Linux 3或者Ubuntu 20.04及以上版本,专有网络模式,开启公网IP,设置登录密码或密钥对。
- 实例规格配置基础要求2核2G,多智能体并行推荐4核8G及以上,系统盘选用ESSD云盘,容量不低于40G。
- 安全组规则新增放行TCP 22、18789端口,临时来源设置为0.0.0.0/0,生产环境限制指定IP段。
- 使用SSH工具连接服务器,执行系统更新与基础依赖安装命令:
Ubuntu系统:
Alibaba Cloud Linux系统:sudo apt update && sudo apt upgrade -y sudo apt install python3 python3-pip git docker.io nodejs -ysudo yum update -y sudo yum install python3 python3-pip git docker nodejs -y
3.3 服务器通用基础优化
- 时区校准,统一服务器时区,避免日志、任务执行时间错乱;
- 关闭不必要系统自带服务,释放内存与CPU资源,保障智能体运行算力;
- 配置磁盘自动扩容,防止长期运行日志、缓存占用磁盘空间导致服务崩溃。
四、Hermes Agent完整部署与Token Plan绑定配置
4.1 Hermes一键安装脚本执行
SSH登录服务器终端,执行官方一键安装脚本,自动拉取程序、配置运行环境:
curl -fsSL https://hermes.ai/install.sh | bash
安装完成后输入版本查看命令,校验安装是否成功:
hermes -v
输出版本号即代表安装无异常,若提示命令不存在,重新执行安装脚本或检查网络连通性。
4.2 命令行绑定百炼Token Plan参数
逐条执行配置指令,替换为自身获取的Token Plan专属API Key与接口地址:
hermes config set model.provider custom
hermes config set model.base_url https://token-plan.cn-beijing.maas.aliyuncs.com/compatible-mode/v1
hermes config set model.api_mode openai_messages
hermes config set model.api_key sk-sp-替换为自己的密钥
hermes config set model.default qwen3.7-plus
hermes config set gateway.port 18789
参数说明:默认模型优先选择Qwen3.7 Plus,兼顾文本推理与多模态能力;仅纯文本超长文档处理场景可修改为qwen3.7-max。
4.3 启动服务并生成Web访问凭证
配置完成后启动Hermes后台服务:
hermes run
新开终端窗口生成管理员访问Token,用于浏览器登录可视化后台:
hermes token generate
复制生成的长串字符妥善保存,无该凭证无法访问智能体管理页面。
4.4 手动配置文件精细化调整(高级自定义)
如需调整模型随机度、单次最大输出长度等参数,直接编辑本地配置文件,文件路径为~/.hermes/config.yaml,修改完成后重启服务生效:
hermes restart
支持自定义temperature数值,严谨公文、数据分析场景设置0.2,创意内容生成场景设置0.7;max_tokens根据业务需求调整上限。
4.5 Hermes开机自启配置
为避免服务器重启后智能体服务中断,配置开机自动运行脚本:
sudo vim /etc/rc.local
文件末尾新增执行指令:
cd /root/.hermes
nohup hermes run > hermes_log.log 2>&1 &
保存退出后赋予文件执行权限:
sudo chmod +x /etc/rc.local
重启服务器测试自启效果,重启后无需手动执行hermes run即可正常访问Web页面。
五、OpenClaw完整部署与Token Plan绑定配置
OpenClaw采用容器化部署方式,依赖Docker环境,轻量服务器预装镜像可跳过Docker安装步骤,ECS手动部署需确认Docker服务正常运行。
5.1 容器拉取与启动基础容器
拉取OpenClaw核心镜像并启动容器实例:
docker pull openclaw/core
docker run -d --name openclaw-core -p 18789:18789 openclaw/core
进入容器内部执行配置操作:
docker exec -it openclaw-core /bin/bash
5.2 容器内配置Token Plan相关参数
依次执行配置命令,填入专属密钥与接口地址:
openclaw config set models.providers.bailian-token.apiKey "sk-sp-替换为自身密钥"
openclaw config set models.providers.bailian-token.baseUrl "https://token-plan.cn-beijing.maas.aliyuncs.com/compatible-mode/v1"
openclaw config set agents.defaults.model.primary "bailian-token/qwen3.7-plus"
openclaw config set models.providers.bailian-token.token_plan_enabled true
开启token_plan_enabled参数是关键,若该参数为false,调用模型时不会抵扣Credits积分,自动切换为按量付费模式,产生额外开销。
5.3 重启服务并生成管理员访问凭证
配置完成后重启网关服务加载新参数:
openclaw gateway restart
生成Web后台登录Token:
openclaw token generate --admin
将生成的访问凭证保存,用于浏览器登录OpenClaw管理界面,可查看任务队列、工具调用记录、模型消耗统计。
5.4 OpenClaw容器开机自启设置
配置Docker容器随服务器开机自动启动:
docker update --restart always openclaw-core
重启服务器验证,重启后容器自动运行,无需手动执行docker run指令。
六、智能体功能验证与Token Plan额度消耗校验
6.1 Web可视化页面访问测试
浏览器输入地址格式 http://服务器公网IP:18789,输入生成的访问Token完成登录,分别进入Hermes、OpenClaw后台页面。
登录成功后可查看模型选择列表、技能开关、任务执行日志、用量统计面板。
6.2 基础对话与工具调用验证
- 简单文本测试指令,输入“简要介绍百炼Token Plan计费模式”,观察模型是否正常返回回答,无报错、无超时代表接口连通正常。
- 工具调用测试指令,输入“编写一段两数求和Python脚本并执行”,智能体自动生成代码、运行并返回结果,代表工具调用链路完整。
- 多模态测试(仅Qwen3.7 Plus支持),上传本地图片,下达分析指令,图片可正常解析代表多模态配置无异常。
6.3 Token Plan积分消耗校验
登录阿里云百炼平台,进入Token Plan用量统计页面,查看Credits实时扣除记录。正常情况下,智能体每一次模型调用都会从套餐积分中抵扣,不会产生按量付费账单。
若未产生积分消耗记录,排查三点:API Key是否为sk-sp开头专属密钥、base_url是否填写Token Plan专属地址、智能体配置内token_plan_enabled是否开启。
七、智能体优化配置与安全管控方案
7.1 技能扩展配置
Hermes与OpenClaw均内置文件处理、代码执行、联网检索、数据查询通用技能,在Web后台技能管理面板一键启用。所有技能调用模型统一消耗Token Plan积分,无需额外单独配置计费。
可自定义专属工作流技能,将重复业务流程固化,一键调用,减少重复指令输入。
7.2 性能优化手段
- 模型分层调度:简单问答、文本过滤使用Qwen3.7 Flash降低积分消耗;图文、自动化任务使用Plus;超长复杂逻辑推理临时切换Max;
- 精简上下文记忆长度,自动清理无用历史对话,减少单次输入Token数量;
- 批量文件处理启用批量推理模式,降低单位Credits消耗;
- 定期更新智能体版本,修复运行bug,提升工具调用稳定性。
7.3 服务器安全加固
- 安全组修改为IP白名单模式,关闭全网公网访问权限;
- 定期轮换Token Plan API Key与智能体Web访问Token,防止凭证泄露;
- 禁止将密钥硬编码写入脚本、配置文件,优先使用环境变量存储敏感参数;
- 开启服务器日志持久化存储,记录所有智能体调用行为,便于异常溯源。
八、高频故障排查指南
8.1 智能体无法连接Token Plan模型接口
- 核对API Key前缀,必须为sk-sp,普通按量付费密钥无法抵扣套餐积分;
- 确认接口地址填写完整无误,未使用通用dashscope基础地址;
- 服务器网络出口无访问拦截,可通过ping测试接口域名连通性;
- 检查Token Plan套餐未过期,Credits积分尚有剩余。
8.2 Web页面无法打开访问
- 确认安全组已放行18789端口,无防火墙拦截;
- 检查智能体服务是否正常运行,重启服务后重试;
- 核对访问Token输入无误,无字符缺失、多余空格。
8.3 Credits积分消耗异常过快
- 对话上下文堆积过多,长期未清理历史记录;
- 频繁使用Max旗舰模型处理简单轻量化任务;
- 上传超大尺寸图片、长视频素材,大幅增加输入Token消耗;
- 调低temperature参数,减少模型冗余输出内容。
8.4 OpenClaw容器启动失败
- 检查Docker服务是否开机自启,执行systemctl start docker手动启动;
- 端口被占用时修改网关端口配置,更换未占用端口;
- 服务器内存不足,升级实例内存规格,关闭后台闲置程序释放资源。
8.5 Hermes执行工具调用报错
- 服务器未安装对应运行依赖(Python、Node等),重新执行依赖安装命令;
- 权限不足,切换root用户运行服务;
- 模型参数max_tokens设置过小,无法承载完整工具执行返回内容。
九、整体落地总结
2026年在阿里云服务器部署Hermes Agent与OpenClaw,并接入百炼Token Plan,是低成本、稳定运行自治AI智能体的标准化落地方案。轻量应用服务器适合零基础快速搭建,开箱即用无需复杂环境配置;ECS云服务器适合需要自定义资源、多智能体并行运行的进阶场景。
整套流程核心分为服务器资源搭建、Token Plan订阅与密钥获取、两款智能体分别部署绑定计费、功能验证与成本管控四大模块,全程配套完整可直接复制的终端命令,降低新手操作门槛。
Token Plan统一Credits积分计费解决了传统按量付费账单波动、预算不可控的痛点,一套积分可自由切换平台全部大模型,适配智能体多场景混合调用需求。同时通过开机自启、白名单安全加固、模型分层调度、用量告警等优化手段,兼顾智能体长期稳定运行、数据安全与使用成本控制。
在实际落地过程中,可根据业务负载灵活调整服务器配置与模型选型,定期查看Token Plan用量统计,及时优化调用逻辑,最大限度发挥智能体自动化能力,同时合理控制AI算力使用开销。