阿里云ECS/轻量服务器部署AI Agent:百炼Token Plan接入与配置详解

简介: 在阿里云服务器上部署AI Agent并接入百炼Token Plan,是快速搭建稳定、低成本、可规模化运行的AI智能体服务的最优路径。依托阿里云服务器的稳定算力与百炼Token Plan的统一Credits计费模式,AI Agent可实现多模型调用、上下文记忆、工具执行等核心能力,无需复杂运维即可支撑个人开发、团队协作与业务落地。本文以主流的Hermes Agent为例,从部署前准备、服务器选型与创建、百炼Token Plan开通与凭证获取、AI Agent部署与配置、功能验证到常见问题排查,提供完整实操流程,覆盖轻量应用服务器一键部署与ECS手动部署两种方案,适配新手与进阶用户需求。

在阿里云服务器上部署AI Agent并接入百炼Token Plan,是快速搭建稳定、低成本、可规模化运行的AI智能体服务的最优路径。依托阿里云服务器的稳定算力与百炼Token Plan的统一Credits计费模式,AI Agent可实现多模型调用、上下文记忆、工具执行等核心能力,无需复杂运维即可支撑个人开发、团队协作与业务落地。本文以主流的Hermes Agent为例,从部署前准备、服务器选型与创建、百炼Token Plan开通与凭证获取、AI Agent部署与配置、功能验证到常见问题排查,提供完整实操流程,覆盖轻量应用服务器一键部署与ECS手动部署两种方案,适配新手与进阶用户需求。阿里云部署AI Agent:OpenClaw/Hermes Agent全网最简单,只需两步,详情👉访问阿里云OpenClaw/Hermes一键部署专题页面 了解。
OpenClaw1.png
OpenClaw2.png
OpenClaw02.png
openClaw3.png
OpenClaw031.png
OpenClaw03.png
OpenClaw04.png
OpenClaw5.png
Openclaw6.png
👉访问订阅阿里云百炼Token Plan AI大模型服务 。支持多模型切换,用于多模态模型灵活调用,实现多模型、多工具、多场景下的额度共享与统一管理,兼顾灵活性、稳定性与安全性,大幅降低企业使用大模型的门槛与成本。
tokenplan1.png
tokenplan1.png
tokenplan2.png
tokenplan3.png
tokenplan4.png

一、部署前核心准备

1.1 阿里云账号与实名认证

首先需注册并登录阿里云账号,完成个人或企业实名认证,这是购买云服务器、开通百炼Token Plan及获取API密钥的必要前提。个人用户可通过支付宝授权快速完成认证,企业用户需上传营业执照审核。若使用RAM子账号操作,需由主账号分配ECS管理员、百炼管理员等权限,确保具备实例创建、配置修改、服务管理等操作权限。

1.2 开通阿里云百炼Token Plan(核心步骤)

百炼Token Plan是面向团队与规模化场景的订阅服务,采用Credits统一积分计费,支持全平台模型调用,是AI Agent长期稳定运行的理想选择。

  1. 登录阿里云百炼大模型服务平台,进入“Token Plan”订阅页面。
  2. 选择套餐档位:标准版(198元/月,25000 Credits)、高级版(698元/月,100000 Credits)、尊享版(1398元/月,250000 Credits),根据使用需求选择单月或连续包月,完成支付订阅。
  3. 获取Token Plan专属API Key:进入百炼控制台“API密钥管理”页面,点击“创建API Key”,选择“Token Plan专属API Key”(格式为sk-sp-xxxxxx),生成后立即复制保存,关闭弹窗后无法再次查看,严禁泄露。
  4. 记录Token Plan专属Base URL:OpenAI兼容协议地址为https://token-plan.cn-beijing.maas.aliyuncs.com/compatible-mode/v1,Anthropic兼容协议地址为https://token-plan.cn-beijing.maas.aliyuncs.com/apps/anthropic,后续配置AI Agent时需使用。

1.3 本地工具与环境准备

  • 远程连接工具:准备FinalShell、Xshell或阿里云Web终端,用于SSH连接服务器执行命令。
  • 文本编辑器:用于保存Token Plan API Key、访问Token等敏感信息,避免丢失。
  • 地域选择:优先选择华北2(北京)或海外地域(如中国香港、美国弗吉尼亚),国内除香港外地域联网搜索功能受限;海外地域无需ICP备案,可直接通过公网IP访问。

二、阿里云服务器创建与基础配置

2.1 方案一:轻量应用服务器一键部署(新手推荐)

轻量应用服务器操作简单、成本低,预装Hermes Agent镜像,无需手动配置环境,适合零基础用户。

  1. 登录阿里云轻量应用服务器控制台,点击“创建实例”。
  2. 选择配置:
    • 镜像:选择“应用镜像”→“Hermes Agent”(已预装所有依赖)。
    • 实例规格:基础场景选择2核2GiB,复杂场景升级至4核4GiB。
    • 地域:优先选择华北2(北京)或海外地域。
    • 时长:根据需求选择1个月、3个月或更长时间。
  3. 完成支付,等待5-10分钟,实例状态变为“运行中”。
  4. 端口放通:进入实例“应用详情”页面,找到“端口放通”区域,点击“一键放通”,自动放行22(SSH)和18789(Hermes Agent Web UI访问)端口。

    零基础部署AI Agent:OpenClaw/Hermes Agent喂饭级步骤流程

    第一步:👉点击打开访问阿里云OpenClaw/Hermes Agent一键部署专题页面
    OpenClaw1.png
    OpenClaw2.png
    OpenClaw02.png
    openClaw3.png
    OpenClaw031.png
    OpenClaw03.png
    OpenClaw04.png
    OpenClaw5.png
    Openclaw6.png

👉访问订阅阿里云百炼Token Plan AI大模型服务 。支持多模型切换,用于多模态模型灵活调用,实现多模型、多工具、多场景下的额度共享与统一管理,兼顾灵活性、稳定性与安全性,大幅降低企业使用大模型的门槛与成本。
tokenplan1.png
tokenplan1.png
tokenplan2.png
tokenplan3.png
tokenplan4.png

第二步:👉打开选择阿里云轻量应用服务器,配置参考如下:

  • 镜像:OpenClaw(或Hermes Agent)镜像(已经购买服务器的用户可以重置系统重新选择镜像)
  • 实例:内存必须2GiB及以上。
  • 地域:默认美国(弗吉尼亚),目前中国内地域(除香港)的轻量应用服务器,联网搜索功能受限。
  • 时长:根据自己的需求及预算选择。

轻量应用服务器OpenClaw镜像.png
bailian1.png
bailian2.png

第三步:打开访问阿里云百炼大模型控制台,找到密钥管理,单击创建API-Key。

阿里云百炼密钥管理图.png

前往轻量应用服务器控制台,找到安装好OpenClaw的实例,进入「应用详情」放行18789端口、配置百炼API-Key、执行命令,生成访问OpenClaw的Token。
阿里云百炼密钥管理图2.png

  • 端口放通:需要放通对应端口的防火墙,单击一键放通即可。
  • 配置百炼API-Key,单击一键配置,输入百炼的API-Key。单击执行命令,写入API-Key。
  • 配置OpenClaw/Hermes:单击执行命令,生成访问OpenClaw/Hermes的Token。
  • 访问控制页面:单击打开网站页面可进入OpenClaw/Hermes对话页面。

阿里云百炼Coding Plan API-Key 获取、配置保姆级教程:

创建API-Key,推荐访问订阅阿里云百炼Coding Plan,阿里云百炼Coding Plan每天两场抢购活动,从按tokens计费升级为按次收费,可以进一步节省费用!
CodingPlan.png

  • 购买后,在控制台生成API Key。注:这里复制并保存好你的API Key,后面要用。
    image.png
  • 回到轻量应用服务器-控制台,单击服务器卡片中的实例 ID,进入服务器概览页。
    image.png
  • 在服务器概览页面单击应用详情页签,进入服务器详情页面。
    image.png
  • 端口放通在OpenClaw使用步骤区域中,单击端口放通下的执行命令,可开放获取OpenClaw 服务运行端口的防火墙。
    image.png
  • 这里系统会列出我们第一步中创建的阿里云百炼 Coding Plan的API Key,直接选择就可以。
    image.png
  • 获取访问地址单击访问 Web UI 面板下的执行命令,获取 OpenClaw WebUI 的地址。
    image.png
    image.png

    2.2 方案二:ECS云服务器手动部署(进阶自定义)

    ECS实例灵活性更高,支持自定义系统与环境,适合有运维经验的用户。
  1. 登录阿里云ECS控制台,点击“创建实例”。
  2. 选择配置:
    • 实例规格:基础场景2核2GiB,复杂场景4核4GiB及以上。
    • 镜像:选择Alibaba Cloud Linux 3或Ubuntu 20.04及以上版本。
    • 系统盘:选择40GiB以上ESSD云盘。
    • 网络:选择“专有网络(VPC)”,启用公网IP,安全组选择默认安全组。
    • 登录凭证:设置登录密码或密钥对。
  3. 完成支付,等待实例创建完成,复制公网IP备用。
  4. 安全组配置:进入ECS实例“安全组”页面,添加规则:协议TCP,端口22、18789,策略允许,来源0.0.0.0/0(测试阶段)。
  5. SSH连接服务器:使用远程连接工具连接ECS实例,更新系统并安装依赖:
    # Ubuntu/Debian
    sudo apt update && sudo apt upgrade -y
    sudo apt install python3 python3-pip nodejs git docker.io -y
    # CentOS
    sudo yum update -y
    sudo yum install python3 python3-pip nodejs git docker -y
    

三、AI Agent(Hermes)部署与百炼Token Plan配置

3.1 轻量应用服务器一键配置(新手推荐)

  1. 进入轻量应用服务器实例“应用详情”页面,找到“配置Hermes”区域。
  2. 点击“初始化配置百炼API Key”,在弹出窗口中填写:
    • 模型厂商:阿里云百炼
    • 认证方式:Token Plan
    • API Key:粘贴Token Plan专属API Key(sk-sp-xxxxxx
    • Base URL:粘贴OpenAI兼容协议地址https://token-plan.cn-beijing.maas.aliyuncs.com/compatible-mode/v1
    • 默认模型:选择qwen3.7-maxqwen3.6-plus
  3. 点击“确定”,系统自动执行配置命令,写入Hermes配置文件。
  4. 点击“生成访问Token”,复制保存Web UI访问凭证,该凭证是访问AI Agent的唯一密钥,严禁泄露。

3.2 ECS服务器命令行配置(进阶用户)

  1. SSH连接ECS实例,安装Hermes Agent:
    curl -fsSL https://hermes.ai/install.sh | bash
    
  2. 配置百炼Token Plan参数,执行以下命令(替换API Key为实际值):
    hermes config set model.provider custom
    hermes config set model.base_url https://token-plan.cn-beijing.maas.aliyuncs.com/compatible-mode/v1
    hermes config set model.api_mode openai_messages
    hermes config set model.api_key sk-sp-xxxxxxxxxxxxxxxxxxxxxxxx
    hermes config set model.default qwen3.7-max
    hermes config set gateway.port 18789
    
  3. 启动Hermes Agent服务:
    hermes run
    
  4. 生成Web UI访问Token:
    hermes token generate
    
    复制生成的Token,用于后续访问Web UI。

3.3 手动编辑配置文件(高级定制)

若需精细化配置,可直接编辑Hermes配置文件~/.hermes/config.yaml

model:
  default: qwen3.7-max
  provider: custom
  base_url: https://token-plan.cn-beijing.maas.aliyuncs.com/compatible-mode/v1
  api_mode: openai_messages
  api_key: sk-sp-xxxxxxxxxxxxxxxxxxxxxxxx
  temperature: 0.7
  max_tokens: 65536
gateway:
  port: 18789
  auth_token: 生成的Web UI访问Token

编辑完成后,重启Hermes服务使配置生效:

hermes restart

四、AI Agent功能验证与Token Plan使用确认

4.1 访问AI Agent Web UI

在浏览器中输入http://服务器公网IP:18789,使用生成的访问Token登录,进入Hermes Agent控制台。控制台可查看模型列表、对话历史、技能配置、日志等信息。

4.2 发起对话与工具调用验证

  1. 在Web UI中选择默认模型(如qwen3.7-max),输入测试指令,如“介绍一下阿里云百炼Token Plan”。
  2. 验证AI Agent响应:若正常返回内容,说明模型调用成功。
  3. 验证工具执行:输入“帮我写一段Python代码,实现两数相加”,确认AI Agent可生成并执行代码。

4.3 确认Token Plan额度消耗

登录阿里云百炼控制台,进入“Token Plan”用量统计页面,查看实时Credits消耗数据。确认AI Agent调用模型时,已正常抵扣Token Plan额度,而非按量计费,避免额外费用。若未消耗,需检查API Key、Base URL是否正确,以及配置文件中model.provider是否为custom

五、AI Agent功能扩展与优化配置

5.1 启用技能与工具

Hermes Agent支持文件处理、代码执行、联网搜索、数据查询等技能,可在Web UI“技能管理”页面启用。所有技能调用模型时,均会统一使用Token Plan额度,无需额外配置。

5.2 调整模型参数

在配置文件中可调整temperature(控制输出随机性,0-1之间)、max_tokens(最大响应长度)等参数,适配不同场景需求。例如,精准问答场景可将temperature设为0.2,创意生成场景设为0.7。

5.3 配置开机自启

为确保服务器重启后AI Agent自动运行,可配置开机自启:

sudo vim /etc/rc.local
# 添加以下内容(替换为实际路径)
cd /root/.hermes
nohup hermes run > hermes_service.log 2>&1 &
# 保存退出后,添加执行权限
sudo chmod +x /etc/rc.local
# 重启服务器验证
sudo reboot

5.4 安全配置优化

  1. 测试完成后,将安全组来源修改为指定IP白名单,禁止公网随意访问。
  2. 定期更新Hermes Agent版本,获取最新功能与安全修复:
    hermes update
    
  3. 启用Web UI访问鉴权,确保仅授权用户可访问。

六、常见问题排查

6.1 AI Agent无法连接百炼Token Plan

  • 检查API Key是否为Token Plan专属(格式sk-sp-xxxxxx),而非通用API Key。
  • 确认Base URL为Token Plan专属地址,未使用通用dashscope地址。
  • 检查服务器网络是否可访问阿里云百炼服务,尝试ping通Base URL域名。

6.2 模型调用失败,无响应

  • 确认Token Plan Credits额度充足,未耗尽。
  • 检查默认模型名称是否正确,需与百炼Token Plan支持的模型名称完全一致。
  • 重启Hermes服务,重新加载配置。

6.3 Web UI无法访问

  • 确认服务器已放通18789端口,安全组规则配置正确。
  • 检查访问Token是否正确,未过期或泄露。
  • 尝试重启Hermes服务与服务器。

6.4 Token Plan额度消耗异常

  • 优化对话历史长度,减少上下文占用。
  • 降低temperature参数,减少模型冗余输出。
  • 选择轻量模型处理简单任务,复杂任务再切换高性能模型。

七、总结

在阿里云服务器部署AI Agent并配置百炼Token Plan,是实现AI智能体稳定、低成本、规模化运行的高效方案。轻量应用服务器一键部署适合新手快速上手,ECS手动部署适合进阶用户自定义配置;百炼Token Plan提供统一Credits计费,支持多模型调用与团队管控,完美适配AI Agent的长期使用需求。

从部署前准备、服务器创建、Token Plan开通与凭证获取,到AI Agent部署、配置、验证与优化,全程操作清晰,无需复杂AI开发经验即可完成。部署完成后,AI Agent可作为强大的数字助手,执行对话交互、代码编写、工具调用、流程自动化等任务,大幅提升个人与团队的工作效率。同时,依托阿里云的稳定算力与百炼的模型能力,可轻松支撑业务落地与规模化扩展,真正实现AI技术的高效落地。

目录
相关文章
|
4天前
|
人工智能 自然语言处理 文字识别
阿里云百炼Qwen3.7-Max简介:能力、优势、支持订阅计划参考
Qwen3.7-Max是阿里云百炼面向智能体时代推出的新一代旗舰模型,对标GPT-5.5、Claude Opus 4.7等闭源旗舰。该模型支持百万级token上下文窗口,具备顶级推理能力、多模态搜索与视觉理解增强、流式输出低延迟响应等核心优势,覆盖编程、办公、长周期自主执行等复杂场景。同时支持OpenAI接口兼容,便于系统快速迁移。用户可通过Token Plan团队或节省计划等订阅方式灵活调用,适合企业级高要求场景使用。
8274 37
阿里云百炼Qwen3.7-Max简介:能力、优势、支持订阅计划参考
|
4天前
|
人工智能 运维 JavaScript
阿里云Qoder CN(原通义灵码)全解析 产品形态、版本划分与技术适配说明
在AI辅助开发与智能办公工具持续普及的当下,阿里云旗下原通义灵码正式更名为Qoder CN,同时延伸出QoderWork CN、Qoder CN CLI、Qoder CN Mobile等多款配套产品,形成覆盖代码开发、日常办公、终端交互、移动端使用的完整工具矩阵。Qoder CN核心定位为AI智能编码助手,深度适配主流代码编辑器、集成开发环境以及终端场景;QoderWork CN则偏向桌面端综合办公辅助,二者面向不同使用场景,划分了多个版本档位,搭配差异化资源配额、功能权限与计费规则,同时兼容多款主流大模型。
567 4
|
4天前
|
JavaScript 定位技术 API
CodeGraph 爆火:编程 Agent 需要的不是更多上下文,而是一张提前画好的代码地图
CodeGraph 是一款爆火的本地代码智能工具,通过 tree-sitter 解析 AST 构建结构化知识图谱(存于 SQLite),为编程 Agent 提前生成“代码地图”。它显著降低 Agent 在中大型项目中的探索成本——实测工具调用减少71%、Token 降57%、速度提升46%,支持19+语言及主流框架路由识别,完全离线、无需 API Key。
539 3
CodeGraph 爆火:编程 Agent 需要的不是更多上下文,而是一张提前画好的代码地图
|
3天前
|
缓存 测试技术 API
Qwen 3.7 Plus 与 Max 实测:性价比与多模态能力差异解析(2026)
2026 年 6 月 1 日,阿里悄无声息地发布了 Qwen 3.7 Plus,距 Qwen 3.7 Max 上线刚好 11 天。同样的 1M 上下文,同样的 35 小时自治上限。但价格才是头条:Plus 是 0.40/M输入,Max是 2.50/M——便宜约 6 倍——并且还能看图、看视频。Vision Arena 上 Plus 已经排到 #16。所以这周真正值得讨论的问题不是”要不要为视觉能力买单”,而是”Max 凭什么用 6 倍价格换来 2 个百分点的 benchmark 领先”。
|
4天前
|
数据采集 人工智能 前端开发
让 Coding Agent 从黑盒到透明:阿里云 Agent 观测审计数据采集实践
AI Agent 规模化落地带来执行黑盒、行为难追溯、成本难度量三大难题。阿里云基于 OTel 标准,面向 Coding Agent、个人通用助理和框架型 Agent,推出 LoongSuite Pilot、插件及探针等无侵入采集方案,让 Agent 实现可看见、可分析、可审计、可治理。
690 148
|
4天前
|
人工智能 缓存 自然语言处理
阿里Qwen3.7-Max评测:Agent能力显著提升,耗时与调用成本大幅下降
阿里云百炼推出面向智能体的旗舰大模型Qwen3.7-Max,具备长周期自主执行能力,显著提升编程、办公自动化等复杂任务处理水平;支持MCP集成与多框架兼容,并以限时5折+100万Tokens免费试用大幅降低使用门槛,助力企业高效落地AI应用。在阿里云百炼平台快速体验:https://t.aliyun.com/U/fPVHqY
1927 10
|
4天前
|
存储 安全 Java
AgentScope Java 2.0:打造分布式、企业级智能体底座
AgentScope 2.0 面向分布式部署、稳定运行、权限安全等企业级需求全面升级,打造支持多租户隔离与长期稳定运行的企业级智能体底座。
|
4天前
|
人工智能 安全 定位技术
CodeGraph深度解析 让Claude Code工具调用直降七成的核心原理与实操教程
如今以Claude Code为代表的AI编程智能体已经成为开发者日常编码、项目重构、漏洞修复的必备工具。但在长期使用过程中,几乎所有开发者都会遇到同一个明显痛点:AI虽然具备强大的代码生成与分析能力,却常常陷入盲目探索的循环中。
1325 2
|
4天前
|
人工智能 运维 API
2026年阿里云百炼通义千问Qwen3.7-plus深度介绍 功能特性、使用优势及618大促订阅方案指南
大模型技术的普及,让AI能力逐步融入个人办公、内容创作、代码编写、企业运营、教育培训等各类场景。不同定位的模型对应不同使用需求,旗舰级模型性能强劲但使用成本偏高,轻量化模型价格低廉却难以胜任复杂任务,而介于两者之间的中端主力模型,凭借均衡的能力、亲民的定价、广泛的场景适配性,成为绝大多数个人用户、小型团队、中小企业的首选。
694 1
|
4天前
|
人工智能 弹性计算 运维
阿里云发布堡垒机智能运维Agent,运维交互进入自然语言新时代
支持自然语言运维,提升效率与安全双保障。
1183 1

热门文章

最新文章