Serverless JManus: 企业生产级通用智能体运行时

简介: JManus 是面向 Java 的企业级通用智能体框架,支持多 Agent 框架、MCP 协议和 PLAN-ACT 模式,具备高可用、弹性伸缩的特性。结合阿里云 Serverless 运行时 SAE 和 FC,实现稳定安全的智能体应用部署与运行。

1.gif


概述:本文介绍如何使用 JManus 框架构建通用智能体应用,部署并运行在 Serverless 运行时,构建企业级高可用智能体应用的实践经验。基于阿里云 Serverless 应用引擎SAE 运行稳定高可用的智能体应用, 基于函数计算 FC 运行安全隔离的工具执行任务,实现最佳的 Serverless 智能体应用运行时。


1. JManus: 面向 Java 的企业级通用智能体框架


1.1 通用多智能体的企业级开发框架


JManus 是一个以 Java 为核心、完全开源的 OpenManus 实现,隶属于 Spring AI Alibaba 项目。


它旨在让 Java 程序员更便捷地使用 AI 技术,支持多 Agent 框架、网页配置 Agent、MCP 协议和 PLAN-ACT 模式。项目在 GitHub 上已获近 3k star,可集成多个大模型如 Claude 3.5 和 Qwen3。


JManus 的核心特点包括:


  • 完美实现了 OpenManus 多 Agent 框架
    借助 Spring AI 和 Java 的深度结合,开发者可以轻松构建和管理多个智能体,让复杂任务的分工与协作变得高效且可控。
  • JManus 无缝支持 MCP(Model Context Protocol)协议
    Agent 不仅可以调用本地或云端的大语言模型,还能与各类外部服务、API、数据库等进行深度交互,极大拓展了应用场景和能力边界。
  • JManus 原生支持 PLAN-ACT 模式
    能够让 Agent 具备复杂推理、分步执行和动态调整的能力,适用于多轮对话、复杂决策、自动化流程等高阶 AI 应用场景。


而随着多智能体业务场景逐渐成熟,企业亟需 JManus 这样的框架来构建通用的业务逻辑。Spring AI Alibaba 也在探索多智能体支持,满足更多用户的需要。



1.2 优秀的运行时性能


基于 Spring AI Alibaba 构建的智能体应用,相比于 Dify 等低代码平台构建的智能体具有明显的性能和可用性优势。


从 Dify 可视化界面一键导出 Spring AI Alibaba 工程。下图展示了基于从 Dify 导出为 SAA 工程,运行模式性能前后的变化:可以看到,基于 Spring AI Alibaba 的智能体在运行性能上大幅领先 Dify 原生的智能体应用。


Dify 智能体压测:



基于 Dify 导出的 Spring AI Alibaba 智能体应用压测:



可见,Dify 适合在测试环境快速验证想法,而生产环境推荐使用性能更好的 SAA Java 运行时。


3. SAE & FC: 弹性高可用 Serverless 运行时


3.1 弹性高可用的智能体运行环境


在智能体应用的构建与运行中,传统的低代码平台架构存在明显瓶颈:所有智能体共享单一 Pod 资源,高流量场景下易导致性能干扰与资源争用。而基于 JManus阿里云 SAE 的智能体应用,通过全栈 Serverless 能力,在高可用性、弹性扩展、性能优化与成本控制等方面展现出显著优势,为智能体应用的规模化落地提供坚实支撑。


基于 Serverless JManus 构建的智能体应用在高可用、弹性、性能方面具有以下明显优势:


1. 高可用性


  • 隔离的网络和资源环境每个智能体应用运行在隔离的 VPC 网络和资源隔离的安全容器中,不同智能体应用享有独占的弹性资源,不会造成性能挤占问题。
  • 多可用区部署
    智能体应用默认部署于多可用区,避免单点故障,保障数据链路的持续可用。
  • 金丝雀发布与灰度流量验证
  • 分批灰度发布通过 SAE 内置的灰度发布策略,逐步将流量切至新版本,降低发布风险。
  • 全链路灰度集成 MSE 微服务治理,支持从网关到应用的全链路灰度流量控制,确保验证过程无损。
  • 无损上下线
    利用微服务治理能力,实现应用的平滑启停,避免因版本切换导致的服务中断。


2. 秒级弹性伸缩


  • 多维度弹性策略
    根据 CPU、内存、QPS、RT 等指标自动触发扩缩容,确保高并发场景下的服务稳定性。
  • 毫秒级资源拉起
    SAE 支持秒级 Pod 启动,快速响应突发流量,避免传统架构因冷启动导致的响应延迟。并针对 Pod 启动阶段进行了深入优化,减少调度和网卡挂载的延迟。


3. 极致性能


  • 加速镜像
    利用阿里云 DADI 技术,加速镜像拉取与启动,缩短应用初始化时间。
  • Java Runtime 启动加速
    特别针对 Java 应用,SAE 提供 JVM 快照类预加载、JIT 优化 等特性,显著降低 JVM 启动耗时。
  • 长连接支持
    集成 CLB/NLB 网关,支持 keep-alive 模式,保障 SSE(Server-Sent Events)等长连接场景的稳定性,避免请求断开。


3.2 工具执行安全隔离的沙箱


在智能体的工具调用或任务执行过程中,安全性和资源效率是两大核心挑战。为应对这一需求,函数计算通过其独特的毫秒级冷启动能力弹性资源调度机制,为工具执行提供了理想的安全沙箱环境,同时结合 MCP 工具市场的生态支持,进一步提升了系统的可靠性和开发效率。


1. 安全沙箱的实现:隔离与防护


  • 容器化隔离
    每个工具调用任务在 FC 中被封装为独立的容器实例,运行于轻量级虚拟机(VM)中,确保任务之间资源隔离,避免因代码缺陷或恶意行为导致的系统崩溃或数据泄露。
  • 权限控制
    FC 支持细粒度的权限管理(如 IAM 角色绑定),限制容器对主机系统、网络及存储的访问权限,防止越权操作。
  • 运行时安全加固
    通过默认禁用高危操作(如文件系统写入、进程创建)和强制使用只读文件系统,进一步降低安全风险。


2. 极致弹性与按需付费


  • 毫秒级冷启动
    函数计算 FC ,能在毫秒级启动容器实例,快速响应瞬时高并发请求,避免传统服务器因预热延迟导致的性能瓶颈。
  • 弹性伸缩
    根据实时流量自动扩缩容,确保在空闲时段仅保留最小资源占用,而在流量高峰时动态分配更多计算资源,实现成本与性能的平衡
  • 按需计费
    仅对实际执行时间(按毫秒计)和资源消耗收费,避免闲置资源浪费,尤其适合智能体工具调用的间歇性高并发特性。


函数计算支持 MCP 市场,也可以一键部署多种 MCP 工具:



4. 实战示例



4.1 部署 JManus 应用到 SAE


1. 申请百炼的 OPENAI_API_KEY

2. 来到 SAE 控制台应用中心,选择 JManus 模版部署 JManus 应用:链接



在部署界面,选择对应的 VPC 网络配置,填入 OPENAI_API_KEY,弹性公网可以选择“新建弹性公网”。



配置好后点击立即创建,即开始部署流程。



3. 部署完成后,在计算巢服务实例“立即使用”这里可以找到能直接访问的地址。



也可以在 SAE 控制台微服务应用中看到 JManus 应用的公网访问地址。




4.2 开发 MCP 服务并部署到函数计算


1. 进入 Function AI 控制台 MCP 市场。

链接


2. 选择实时天气 MCP 服务,一键部署,部署完成后就可以得到可以远端访问的 SSE 地址。





4.3 JManus 自定义智能体和 MCP 配置


基于社区版的 JManus 也提可以直接配置 MCP 服务和创建智能体的能力,回到对话界面的“设置”,然后配置 MCP 服务。




在 JManus 的 MCP 配置上添加函数极端的 MCP 服务地址:


{
  "mcpServers": {
    "openwether": {
      "type": "sse",
      "url": "https://defauxxx-xxxxxx.cn-shanghai-vpc.fcapp.run/sse", 
      "timeout": 45000
    }
  }
}


创建智能体并为智能体配置工具:




配置好后,可以回到对话框,询问天气,可以看到智能体的工具调用的执行,返回了实时的天气信息。



5. 总结


本文展示了基于 Serverless 平台 SAE Serverless 应用引擎和 FC 函数计算,作为 JManus 框架的运行时,能达到强强联合的效果,满足通用智能体开发的业务场景需求,又满足企业生产级高可用的运行时环境。


并且基于 Serverless 安全容器,能满足 browser use 等工具和代码执行的安全隔离环境需求,是用户基于云原生构建智能体应用的不二选择。


未来 SAE 将和 Spring AI Alibaba 做更深入的集成,提供最佳 Java 智能体应用运行时。

作者介绍
目录

相关产品

  • 函数计算