「Agent 友好」的可观测:阿里云发布观测与智能运维 Skills

简介: 开发者只需在 Qoder 等 Agent 客户端中发出一句自然语言指令。借助云监控与STAROps Skill,Agent 即可自主完成数据接入、告警配置、根因诊断,并联动研发工具链完成代码修复与发布。

6 月 25 日,阿里云飞天发布时刻发布阿里云 Skills 官网,以 Agent 为新的操作主体,重构云能力的统一调用入口。


阿里云可观测体系作为阿里云核心服务之一,在 Agent 友好化方向上率先迈出关键一步。阿里云将云监控 CMS、日志服务 SLS、应用实时监控服务 ARMS、全域智能运维平台 STAROps 的核心能力封装为 Agentic Skills,让 Agent 可以直接调用可观测能力。本次发布会上,云监控 Skills、STAROps Skills 作为首批 Agentic Skills 正式上线。


开发者在 Qoder 等 Agent 客户端中发出一句自然语言指令,Agent 即可自主完成数据接入、告警配置、根因诊断,并联动研发工具链完成代码修复与发布。

首批发布:基于 Skill 的全栈可观测与智能诊断

本次发布会上,阿里云智能高级技术专家张城重点演示了云监控 Skills 和 STAROps Skills 驱动的全域可观测与智能诊断实践:


  • 云监控 Skills: 把告警配置、数据接入等高频运维动作封装为 Agent 可直接调用的标准指令。云监控支持上百种云产品,以及移动端、小程序、多语言应用、大模型、Agent 等多端全栈场景的数据接入,Skills 让这些能力以自然语言方式被调用。
  • STAROps Skills: 把健康度诊断与根因定位能力开放给 Agent 客户端调用,支持持续对话与多轮追问。

这套 Skills 体系为企业提供了一条从存量监控体系平滑过渡到 Agentic Ops 的路径,既支持在现有工作流中嵌入 AI 提效,也支持企业为关键业务构建 Agent 原生的诊断模式:


  • 全栈数据覆盖: 云监控一站式接入云产品、移动端、小程序、多语言应用、大模型、Agent 等全栈对象的指标、链路、日志、事件数据。
  • 运维数字孪生: UModel 对采集到的数据做语义化建模,对各类 IT 资源、业务资源进行本体化建模,打通跨域对象。
  • 智能诊断与运维: STAROps 基于大模型完成多维数据分析、告警实时诊断与根因推理,给出可追溯到代码变更的根因结论,并提供恢复建议。
  • Agent 友好: STAROps 提供适合大模型调用的 API 与 CLI;Skills 内置参数 Schema 与多重校验逻辑,确保 Agent 生成的配置项字段合理,避免误配。

应用实战:AI Native DevOps 全链路闭环

Qoder 作为研发侧统一入口,调用云监控 Skills、STAROps Skills 与云效 MCP,UModel 实现研发域与运维域的跨层数据打通。基于这套架构,编码→发布→告警→诊断→修复形成全链路闭环:


  • 编码:开发者在 Qoder 中编写代码。
  • 发布:Qoder 通过云效 MCP 触发云效平台的代码提交、流水线构建与镜像产出,镜像推送至容器镜像服务,由容器服务(K8s 集群)拉起客户应用。
  • 告警:云监控 Skills 为应用、容器、镜像配置数据接入与告警规则,线上异常即时触发。
  • 诊断:告警触发后,Qoder 调用 STAROps Skills,借助 UModel 的跨域关联,从指标异动追溯到 Deployment 变更、再回到具体的代码发布与提交人,给出结构化根因。
  • 修复:Qoder 直接生成修复代码,通过云效 MCP 在 Codeup 上发起 Pull Request(合并请求),自动附带问题背景与根因分析,进入 Review。

最佳实践:从告警配置到问题修复

告警配置: 告警配置是开发者高频重复的运维操作之一。云监控 Skills 可在 Qoder 等 Agent 客户端通过一条命令完成安装。在 Qoder 中下达“为这个集群配置 CPU 告警”的指令,Agent 会基于 Skills 自动拆解为告警规则配置、Webhook 通知设置等子任务,由 Skills 内置的 Schema 与校验逻辑保障字段配置的合法性。

点击此处,查看视频:https://mp.weixin.qq.com/s/hMtxbnk8JibX_UVGKanQVw


告警诊断: 当线上告警触发时,开发者可将告警信息直接输入 Qoder,结合 STAROps Skills 快速完成根因诊断,给出初步的根因判断。由于 STAROps 具备 Agent 原生的交互能力,可继续追问“这次问题由哪次发布引起”。因为接入了云效 DevOps 数据,Agent 能诊断出具体哪次发布引入了问题、关联的流水线执行情况、发布时间与监控指标变化的关联性,最终给出综合性的根因结论。


代码修复: 当所有现象和根因都已明确后,Qoder 直接修复相关代码,通过云效 MCP 在 Codeup 上发起 Pull Request;请求中自动附带问题背景、根因分析与修复说明。

点击此处,查看视频:https://mp.weixin.qq.com/s/hMtxbnk8JibX_UVGKanQVw


云监控 Skills、STAROps Skills 现已上线阿里云 Skills 官网,可在 Qoder 等 Agent 客户端一键安装。通过将监控、诊断、研发工具链以 Skills 和 MCP 的形式开放给 AI Agent,阿里云让“告警 - 定位 - 修复 - 发布”这条原本需要多人协作、跨平台操作的链路,可以在同一个 Agent 对话界面中端到端完成,全面提升了运维效率,让研发和运维之间的协作更加顺畅、智能。


立即体验:https://skills.aliyun.com/skills?category=middleware&orderBy=install

相关文章
|
5天前
|
人工智能 定位技术 SEO
我学 GEO 第 15 天:终于知道AI GEO该如何做?
我是暴走的莉莉酱,边旅行边研究AI GEO的数字游民。专注普通人如何提升“AI可见度”——让AI在回答用户问题时准确识别、理解并推荐你。不讲玄学,只做可测、可调、可持续的GEO实践。
419 125
|
8天前
|
机器学习/深度学习 人工智能 调度
🐴 HappyHorse 1.1 现已上线阿里云百炼!快来查收模型使用指南,现在调用享 6 折~
HappyHorse 1.1 是新一代视频生成大模型,全面升级动态表现力、角色一致性、指令遵循、视觉质感与音画协同能力。支持I2V/T2V/R2V三类生成,适配短剧、电商广告、品牌营销等场景,提供高质、流畅、可控的AI视频生产力。
703 5
🐴 HappyHorse 1.1 现已上线阿里云百炼!快来查收模型使用指南,现在调用享 6 折~
|
5天前
|
缓存 人工智能 运维
阿里云618百炼大模型Qwen3.7-Max功能、免费试用、订阅计费、配置接入详解
Qwen3.7-MAX是阿里云百炼平台推出的通义千问3.7系列旗舰大语言模型,专为智能体时代复杂任务打造,依托阿里云全域算力与自研技术,在逻辑推理、长文本处理、代码工程、长周期自主执行等领域达到行业顶尖水平。2026年618期间,该模型推出多重免费试用权益、按量计费5折、订阅套餐优惠等专属福利,覆盖个人开发者、团队与企业全场景需求,以下从核心功能、免费试用、订阅计费、配置接入四方面展开详细解析。
410 123
|
3天前
|
人工智能 自然语言处理 API
阿里云Token Plan团队版解析:功能、三档套餐与省钱订阅指南
阿里云百炼平台推出的Token Plan团队版,是面向企业与团队的AI大模型订阅服务,以Credits为统一计量单位,整合文本与图像生成模型,提供团队管理、数据安全、多工具兼容等核心能力,解决团队零散订阅AI服务的管理混乱、成本失控、数据安全等痛点。本文将从核心定位、套餐详情、计费规则、团队管理、工具兼容、便宜订阅技巧等方面,全面解析Token Plan团队版,帮助企业与团队高效、低成本地使用AI服务。
304 108
|
4天前
|
存储 人工智能 数据可视化
别再手动复制 Skill 了:多 Agent 时代的 Skill 管理方案
多 Agent 场景下 Skill 的统一管理与同步。
250 125
|
18天前
|
缓存 测试技术 API
Qwen 3.7 Plus 与 Max 实测:性价比与多模态能力差异解析(2026)
2026 年 6 月 1 日,阿里悄无声息地发布了 Qwen 3.7 Plus,距 Qwen 3.7 Max 上线刚好 11 天。同样的 1M 上下文,同样的 35 小时自治上限。但价格才是头条:Plus 是 0.40/M输入,Max是 2.50/M——便宜约 6 倍——并且还能看图、看视频。Vision Arena 上 Plus 已经排到 #16。所以这周真正值得讨论的问题不是”要不要为视觉能力买单”,而是”Max 凭什么用 6 倍价格换来 2 个百分点的 benchmark 领先”。
|
12天前
|
缓存 人工智能 运维
GLM 5.2自托管全流程实战:硬件选型、vLLM/SGLang部署与成本盈亏测算
2026年智谱发布GLM 5.2超大混合专家模型,区别于以往仅开放API的闭源大模型,该模型权重以MIT开源协议对外发布,企业与开发者可完整下载、本地审计、私有化部署,实现数据不出环境、自定义微调、自主调度推理资源。GLM 5.2拥有753B总参数,原生支持百万级上下文窗口,在代码生成、长文档推理、数学逻辑等多项基准测试中对标国际顶尖商用模型,是首款可完整自托管的前沿代码向大模型。
921 0
|
13天前
|
Linux 程序员 数据格式
【2026最新】Notepad++下载、安装和使用一篇搞定(附中文版安装包)
Notepad++ 是一款免费开源、轻量高效的 Windows 文本编辑器,支持 C/Python/HTML 等 80+ 语言语法高亮、代码折叠、正则替换、编码转换及插件扩展,专为程序员与文本处理用户打造,完美替代系统记事本。(239字)

热门文章

最新文章