作者:盈楹
近日,Agentic AICon —— 智能体基础设施与 AgentOps 专场圆满落幕。本场活动吸引了 180+ 名技术从业者参与,现场聚焦 Agent 规模化落地的基础设施层,深度分享了 Agent Infra、HiClaw、AgentRun、AgentLoop、STAROps、RocketMQ 等相关议题,系统拆解了企业 Agent 从构建部署、规模化运行、观测评估到智能运维的全生命周期工程实践。
关注「阿里云云原生」公众号,后台回复:0609
免费获得专场讲师 PPT 合辑
精彩回顾
议题一:从构建、部署到规模化运行,加速企业 Agent 工程化丨李国强,阿里云智能云原生产品负责人、资深产品专家
阿里云推出覆盖构建、部署、治理、运维及优化全周期的 Agent Infra 解决方案,旨在加速企业跨越智能体工程化鸿沟。该方案整合了 AgentRun、AgentTeams(HiClaw)、AgentLoop 与 STAROps 四大核心产品,提供从理论到实战的完整路径,系统性解决企业在多智能体协作、成本控制与效果评估等关键痛点,推动 AI 应用规模化落地。
议题二:HiClaw — 多 Agent 协作与治理方案丨王泉力 阿里云智能产品解决方案架构师
HiClaw 是面向企业级的多 Agent 协作与治理平台,采用 Manager-Team TL-Workers 组织架构与 Matrix 协议实现透明化协同。平台通过统一的 AI 网关进行鉴权与流量管控,结合资产管控与全链路可观测性,有效解决密钥泄露与成本黑洞问题。它支持不同引擎混编,灵活适配从个人“一人公司”到企业“数字联邦”的安全部署需求。
议题三:智能化 Agent Infra AgentRun 如何让 Agent 从 Demo 走向生产丨刘宇,阿里云智能产品专家
AgentRun 作为面向生产环境的智能化、多 Agent 协同/调度运行时底座,基于 Serverless 架构致力于解决长周期任务执行、海量工具调用与安全隔离难题。通过沙箱运行环境、会话亲和性与极致弹性能力,该平台将复杂的 AI 推理转化为稳定且低成本的云服务,有效支撑深势科技、秒悟等标杆客户实现从 Demo 到生产环境的平稳过渡。
议题四:Agent 进化论:AgentLoop 助力智能体构建进化数据飞轮丨夏明,阿里云智能高级产品专家
AgentLoop 针对企业级智能体运行中“效果黑盒”、“变更失控”及“优化困难”三大痛点,提供全栈无侵入观测与持续评估优化闭环。系统引入“Agent-as-a-Judge”评估机制替代人工抽检或“LLM-as-a-Judge”,实现真实效果评估与分钟级质量退化预警;通过构建数据驱动的进化飞轮,让智能体具备自我反思与持续迭代能力,实现全生命周期的可观测、可评估、可优化。
议题五:实战案例:阿里云全域智能运维平台 STAROps 工程设计实践丨刘嘉鹏,阿里云智能技术专家
STAROps 全域智能运维平台以 UModel 统一运维上下文,将日志、指标与拓扑等底层运维数据转化为 AI 可理解、可推理的世界模型。依托 Mission 长周期任务机制与 ToolService 安全体系,STAROps Agent 具备 7×24 小时自主巡检、根因分析与故障自愈能力,推动生产运维从被动响应迈向主动自治的 Agentic Ops 新阶段。
议题六:让 Agent 不再等待:基于 RocketMQ 的异步协作架构实战丨周礼,阿里云智能高级技术专家
基于 RocketMQ 的异步 Agent 会话网关专为解决 AI 应用异步化带来的消息堆积与阻塞问题而设计。其引入 LiteTopic 轻量事件载体,通过差异化订阅、物理隔离与精准流控机制,彻底消除传统广播模式下的队头阻塞。该架构支持百万级队列的高效管理与断连恢复,保障高并发场景下多智能体协作的稳定调度。
现场精彩瞬间