阿里云新发的AgentRun 有哪些“大招”,一文详解来了

简介: 函数计算 AgentRun 是一站式 Agentic AI 基础设施平台,基于 Serverless 架构,提供毫秒弹性、安全沙箱、模型工具治理、全链路可观测等能力,助力企业实现从原型到生产的平滑演进,让 AI Agent 真正落地生产。

AI Agent 正从技术概念快步走向生产应用。然而,当开发者试图将原型推向生产环境时,一道巨大的“生产化鸿沟”随之显现:众多开源框架虽提供了强大的“大脑”,却缺失了企业级应用赖以为生的“基础设施”。

开发者实现从“原型”到“产品”的每一步,都充满了基础设施的挑战。要跨越这道鸿沟,需要的不仅仅是更聪明的模型,而是能全面解决这些问题的基础设施平台。这正是我们开发函数计算 AgentRun 的初衷。

企业级 Agent 面临的三个痛点

  1. 执行环境复杂、运维困难运行时环境与沙箱为 Agent 提供需要执行代码、操作浏览器、调用系统能力,往往会面临一系列挑战:配置多语言、管理依赖和更新安全补丁等产生高昂的维护负担;传统运行环境在大规模并发执行下的性能瓶颈;脆弱的安全隔离可能引发数据泄露等重大风险。更关键的是,日益复杂的会话状态管理也让 Agent 开发复杂度指数级增长。
  2. 外部依赖不稳定、成本高大模型调用稳定性是 Agent 应用的最大隐患。模型厂商的限流、超时、服务中断时有发生,一旦主模型出现问题,整个应用就会瘫痪。同时,Agent 需要调用大量工具和 API,每个工具的集成都要处理不同的调用方式、参数格式、鉴权逻辑,开发维护成本极高。更棘手的是,企业对接多个模型和工具,但缺乏统一的容错和治理机制,成本快速累加却难以优化。
  3. 运行过程的“黑盒”状态
    Agent 应用的调用链路复杂,从用户请求到模型推理、知识库检索、工具调用、MCP 执行,中间经过多个环节且可能反复调用。任何一个环节的性能瓶颈或错误都会影响最终效果,但传统日志和监控手段很难清晰追踪整个过程。开发者不知道哪个环节慢、哪里出错,这种黑盒状态让问题定位和成本优化都极其困难。

显然,要让 Agent 应用真正落地,开发者迫切需要一个能屏蔽底层复杂性、具备一站式治理能力的专业级基础设施平台。

函数计算 AgenRun 是什么?

一句话介绍: 函数计算 AgentRun 是一个以高代码为核心的一站式 Agentic AI 基础设施平台。秉持生态开放和灵活组装的理念,为企业级 Agent 应用提供从开发、部署到运维的全生命周期管理。

函数计算 AgentRun 架构图

AgentRun 运行时基于阿里云函数计算 FC 构建,继承了 Serverless 计算极致弹性、按量付费、零运维的核心优势。通过深度集成 AgentScope、Langchain、RAGFlow、Mem0 等主流开源生态。AgentRun 将 Serverless 的极致弹性、零运维和按量付费的特性与 AI 原生应用场景深度融合,助力企业实现成本与效率的极致优化,平均 TCO 降低 60%

让开发者只需专注于 Agent 的业务逻辑创新,无需关心底层基础设施,让 Agentic AI 真正进入企业生产环境。

立即体验 AgentRun(建议PC端打开):https://fcnext.console.aliyun.com/agent-run/cn-hangzhou/agent/explore

五大核心能力,解决企业级 Agent 生产场景难题

开发者开发— AgentRun—用户使用

核心功能 1:毫秒级极致弹性,真正按需付费

AgentRun 针对 Agent 特性深度优化,实现性能与成本的极致平衡。

  • 极致弹性:支持从 0 到百万级并发极致弹性,配合忙闲时精细化计费,大幅降低成本。
  • 浅休眠与深休眠:通过请求感知调度、实例冻结以及内存快照技术,实现 Agent 运行时与沙箱在无请求时自动休眠。浅休眠1毫秒极速唤醒实现百倍性能加速,性能超越传统服务器、虚拟机和容器等。深休眠实现超长时间会话状态持久化以及秒级唤醒。
  • 会话亲和:借助会话亲和机制将同一会话精准路由至同一实例,突破 Serverless 无状态限制,为 Agent 提供持久的有状态上下文环境,确保复杂多轮对话的流畅性。

核心功能 2:企业级安全沙箱 Sandbox

AgentRun 提供 Code Interpreter、Browser Tool、All In One 等安全沙箱。

  • 高性能执行环境:内置开箱即用的多语言执行引擎与浏览器自动化引擎,可执行数据分析、网页抓取、表单填写等复杂任务。
  • 企业级安全保障:通过请求、实例、会话多维度算力隔离与动态挂载技术,确保数据、资源强隔离;支持细粒度权限控制与完整的日志审计功能。

核心功能 3:模型与工具的统一治理

  • 模型治理: 通过统一模型代理屏蔽 API 差异,提供模型熔断、多模型 Fallback 和负载均衡等高可用保障,以及内容审核、敏感信息过滤等安全合规能力。
  • 工具治理: 采用 MCP 标准化封装,支持 MCP 和 Function Call 双协议,通过插件机制提供自定义 Hook、智能路由、语义分析等扩展功能。

核心功能 4:全链路可观测

基于全链路追踪技术,AgentRun 实现了从请求到响应的完整可视化。精准还原 Agent 的决策路径,包括意图理解、模型推理、工具调用及知识检索等核心环节,并直观展示每一步的状态与耗时。这使得开发者能够快速定位性能瓶颈,告别盲目调试,从而大幅降低优化成本。

核心功能 5:生态开放与工程化演进

拥抱生态、开放不锁定是 AgentRun 的设计哲学

  • 无缝集成业界主流高代码框架:只需几行代码,即可将 AgentRun 的基础设施集成到业界主流高代码框架,如 AgentScope、Langchain、LlamaIndex、CrewAI、Google ADK 等。
  • 无代码到高代码一键转换:支持无代码快速搭建 Agent 实现业务敏捷落地。随着业务复杂度提升,平台支持将可视化配置转化为工程化代码,结构清晰、易于维护,轻松实现从无代码到高代码的一键转换能力,从根源上规避了重构带来的技术债务。
  • 技术自主与数据安全:深度集成 LiteLLM、Mem0、RagFlow 等开源生态组件,提供云端托管或私有化部署,确保技术自主与数据安全。

三个实测场景:AgentRun 能解决什么具体问题?

场景1:不懂代码,但希望创建生产级 Agent

“我懂业务,但不懂代码,就应该被挡在 AI 应用开发的大门之外吗?”

AgentRun 通过无代码/低代码生成 Agent 的方式打破技术壁垒。让业务人员无需编写任何代码,通过可视化界面或“一句话描述”,就能即时创建出功能强大的 Agent。更重要的是,每一个 Agent、Sandbox 都能以 MCP 形式提供,让 Agent 不仅可以调用外部工具,也能调用其他 Agent,实现像“乐高”一样相互调用的能力,组合出更复杂的应用。

不仅如此,随着业务复杂度的升级,只需一键即可将无代码 Agent 转换为高代码 Agent。技术团队可以无缝接手进行深度开发,彻底解决了低代码平台常见的“天花板”问题,实现了从快速验证到专业开发的平滑演进。

场景2:流量突增,Agent 模型服务不稳定

“我之前做过很多 AI 应用,流量少的时候还好,流量一多就头疼,限流、欠费、被封,随时会瘫痪。”

AgentRun 通过模型治理为 Agent 应用提供了一个“智能保险系统”。当主模型出现问题时,平台会自动熔断并秒级切换到备用模型,多级 Fallback 机制保障生产级 Agent 高可用。自动监控每个模型的可用性、响应时间、成功率,智能选择最优的模型。负载均衡能力可以配置多个模型实例,将流量分发到不同的账号、不同的区域,避免单点过载。成本监控会实时追踪每个模型的调用费用,当费用接近阈值时自动预警,甚至可以自动触发限流或降级策略。安全围栏会在模型调用前后自动进行内容审核和敏感信息过滤,确保合规性。

场景3:凭证管理:零信任环境下的动态凭证注入

“如何在不泄露用户密钥(AccessKey)的前提下,让 Agent 安全地调用需要权限的工具?这是一个巨大的安全挑战。”

AgentRun 首创的凭证管理功能,通过 Hook 机制完美解决标准 MCP 协议不支持动态注入的问题,它就像一个“安全中介”,在 Agent 调用工具前(前置Hook)会拦截请求,根据用户身份从凭证库中动态注入密钥;在任务完成后(后置 Hook)立即清理所有敏感信息并记录审计日志。整个过程,大模型和外部环境完全接触不到真实密钥,无懈可击。此外,AgentRun 支持将多个 API 打包成一个 MCP 工具,通过规则路由和智能路由能力,节约成本和提升性能。

函数计算 AgentRun 的落地实践

  • 模型服务:函数计算 AgentRun与国内最大的 AI 模型社区 ModelScope 魔搭深度合作。通过 AgentRun,开发者可实现一键托管,最快 30 秒将开源模型转化为生产级可用、兼容 OpenAI 规范的 API,无需进行繁琐的环境搭建和部署,大幅加速了从模型到应用的“最后一公里”。吉利/极氪等头部厂商,也大量使用模型运行时托管文生图,文生语音等领域模型,支撑智能座舱等关键业务。
  • 智能体应用:函数计算 AgentRun 支撑多家行业头部基础模型厂商,构建面向千万用户的 C 端智能体应用如 Z.ai。通过 AgentRun 提供的虚拟机级安全隔离、大规模实时弹性以及忙闲智能计费,完美解决了稀疏调用与“爆款”流量并存的复杂场景,实现了安全、体验与成本的极致平衡。
  • AI 工具生态:函数计算 AgentRun 为阿里云百炼 MCP Server 提供 Serverless 运行时底座。AgentRun 的实例缩 0 和闲置计费等能力,让这些工具服务在没有流量时,成本降低 85%,甚至为 0。除此之外,Qwen 模型训练中的强化学习任务,通过函数计算 Sandbox 支撑脉冲式负载,峰值规模达到数十万核。

立即开始:一步从 Demo 到生产

总结&展望

AgentRun 的愿景很简单:让 AI Agent 从 Demo 到生产级部署,变得前所未有的简单。通过 Serverless 架构持续优化成本并解放运维负担,通过企业级 Runtime 提供生产级的执行环境和安全保障,通过开源生态集成避免框架锁定,通过全链路可观测让每个环节都清晰可控——这就是 AgentRun 要为企业提供的完整解决方案。

我们深知,Agent 应用的真正价值,不在于演示有多炫酷,而在于能否真正稳定、安全、高效地为企业创造价值。这正是我们打造 AgentRun 的初心,也是我们持续投入和优化的方向。无论您是想快速验证想法的创业者,还是构建企业级应用的开发团队,AgentRun 都将是您从第一行代码到百万级用户,始终值得信赖的基础设施伙伴。

一图看懂 AgentRun

相关文章
|
1月前
|
人工智能 运维 安全
一文看懂函数计算 AgentRun,让 Agentic AI 加速进入企业生产环境
AgentRun 的愿景很简单:让 AI Agent 从 Demo 到生产级部署,变得前所未有的简单。通过 Serverless 架构持续优化成本并解放运维负担,通过企业级 Runtime 提供生产级的执行环境和安全保障,通过开源生态集成避免框架锁定,通过全链路可观测让每个环节都清晰可控——这就是 AgentRun 要为企业提供的完整解决方案。
|
1月前
|
人工智能 运维 Serverless
AgentScope 拥抱函数计算 FC,为 Agent 应用提供 Serverless 运行底座
AgentScope推出Serverless运行时,直面AI Agent部署成本高、运维复杂、资源利用率低三大痛点。通过“按需启动、毫秒弹性、零运维”架构,实现低成本、高弹性、强隔离的智能体部署,助力多智能体应用从实验迈向规模化落地。
|
1月前
|
人工智能 安全 Serverless
AgentRun Sandbox SDK 正式开源!集成 LangChain 等主流框架,一键开启智能体沙箱新体验
AgentRun Sandbox SDK 开源发布,基于Serverless架构提供安全、弹性的智能体运行环境。支持LangChain、AgentScope等主流框架,内置代码解释、浏览器操作等多模态沙箱能力,助力Agentic AI快速落地,让开发更轻盈,云端更安全。
|
1月前
|
人工智能 运维 安全
探秘 AgentRun丨流量一大就瘫痪?如何解决 AI 模型调用之痛
AgentRun 通过完整的模型管理和治理能力,解决模型调用的可靠性的难题。
|
3天前
|
数据采集 人工智能 运维
AgentRun 实战:快速构建 AI 舆情实时分析专家
本方案基于函数计算AgentRun平台,打造自动化、可视化的实时舆情分析系统。通过流式架构与隔离浏览器沙箱,实现从数据采集到报告生成的全流程智能处理,解决传统系统滞后、低效、难扩展等痛点,助力企业精准洞察舆论动态。
AgentRun 实战:快速构建 AI 舆情实时分析专家
|
1月前
|
人工智能 运维 负载均衡
AgentRun上线!5分钟完成企业级Agent构建
阿里云发布函数计算AgentRun,基于Serverless架构打造一站式Agentic AI基础设施,深度融合AI场景,实现毫秒级弹性、按需付费、安全沙箱与全链路可观测,助力企业降本60%,加速AI Agent高效落地生产环境。
408 0
AgentRun上线!5分钟完成企业级Agent构建
|
3月前
|
人工智能 安全 Java
分布式 Multi Agent 安全高可用探索与实践
在人工智能加速发展的今天,AI Agent 正在成为推动“人工智能+”战略落地的核心引擎。无论是技术趋势还是政策导向,都预示着一场深刻的变革正在发生。如果你也在探索 Agent 的应用场景,欢迎关注 AgentScope 项目,或尝试使用阿里云 MSE + Higress + Nacos 构建属于你的 AI 原生应用。一起,走进智能体的新世界。
978 65
|
9天前
|
人工智能 运维 监控
进阶指南:BrowserUse + AgentRun Sandbox 最佳实践
本文将深入讲解 BrowserUse 框架集成、提供类 Manus Agent 的代码示例、Sandbox 高级生命周期管理、性能优化与生产部署策略。涵盖连接池设计、安全控制、可观测性建设及成本优化方案,助力构建高效、稳定、可扩展的 AI 浏览器自动化系统。
212 24
|
1月前
|
人工智能 缓存 运维
探秘 AgentRun|通过无代码创建的 Agent,如何用高代码进行更新?
阿里云函数计算 AgentRun 全新发布,推出“无代码快速创建+高代码深度定制”一体化方案。60秒上线首个Agent,开发者亦能一键转为高代码持续演进。支持多模型、工具集成与智能优化,助力企业实现从想法验证到生产落地的平滑升级,降低TCO达60%。