2025 AI 原生编程挑战赛收官,5500+ 战队攻关 AIOps 工程化闭环

简介: 让天下没有难查的故障,决赛现场精彩回顾。

1 月 14 日,由阿里云主办、云原生应用平台承办的“2025 AI 原生编程挑战赛”圆满收官。历经 2 个多月的角逐,6 支队伍从 5500 多支报名战队中脱颖而出,在云原生环境下跑通 AIOps Agent 的核心技术闭环,成功晋级决赛。最终,来自汽车行业的企业级战队“V-AI”获得总冠军。

1769738592438_750bccf7244540e7b5aa800f939f8bbb.png

AI 原生编程挑战赛由发展历程超过 10 年的“云原生编程挑战赛”升维而来。自 2015 年创办至今,该赛事已连续举办十一届,累计吸引全球 10 余个国家和地区的 96,000 多支战队参与。


作为国内聚焦 AI 原生编程与运维场景融合的重磅赛事,本次大赛自启动就展现出“破圈”影响力,参赛选手遍布包括清华大学、中科院等在内的 180 多所国内外高校及 120 多家企业。大赛核心命题在于将大模型的推理潜能引入运维实战。选手基于部署在阿里云跨可用区的真实电商服务,通过官方提供的真实多模态可观测数据(Log、Metric、Trace、Entity、Event)构建 AI 驱动的智能运维 Agent,实现对复杂云原生系统中未知故障的自动根因诊断。


广邀全球开发者共赴“让天下没有难查的故障”的技术实践,大赛组委会提供了通过云监控 2.0 白屏化操作、通过 SPL/SQL 语句分析诊断、Workflow/Agent 自动化三种解题路径,配以最小可复现步骤、示例查询与产出要求指导,帮助选手借助 AI 快速、准确、低成本地进行故障根因诊断,收获参赛作品超 1000 份。


总决赛现场,阿里云智能集团副总裁、基础设施事业部负责人蒋江伟,阿里云智能集团副总裁、市场营销部负责人刘湘雯为冠军战队“V-AI”颁奖。

1769738693188_d9299a7087294ec2bab338eebdb2d317.png

蒋江伟表示,这次 AI 原生编程挑战赛见证了 AI Agent 在处理复杂运维问题上的潜力。选手们在大赛中释放出的创新活力与技术灵感,让我们看到 AI 与研发、测试与运维全链路的深度融合,正在为构建标准化、可规模化扩展的智能运维新范式夯实根基。


刘湘雯在祝贺获奖战队时指出,从云原生到 AI 原生,大赛的愿景随着技术的演进不断迭代。希望参赛开发者以本次大赛作为起点,继续勇敢破界,在实战中打磨,让更多创新构想精准落地。


来自华中科技大学计算机学院的“HUST-B507”战队及个人开发者战队“我就看看不参加”分获亚军和季军,阿里云智能集团资深技术专家司徒放、云原生应用平台负责人周琦为获奖战队颁奖。

阿里云智能云原生应用平台运营负责人王荣刚、产品营销市场负责人陆俊为 3 支个人开发者战队“scaner”、皮卡丘的皮卡”、“那个男孩儿”颁发优胜奖鼓励选手在智能运维领域持续探索。

1769738782350_a89fbb36fbdf4baca9866353aa81eafb.png

代表冠军战队 V-AI 分享的车企领域架构师朱迪表示:“工作中的大量 IT 运维工作,让我们面对着提升效率、降低成本挑战。在这次比赛中我们不仅提升了技术,也加深了对阿里云可观测产品的理解,加速解决实际故障的效率。通过比赛,我们更加相信 AI 与运维的融合是必然趋势。感谢组委会的支持,期待与阿里云继续携手共进,迎接更加智能的未来。”


多位参赛队伍及选手分享经验时提到,阿里云云监控 2.0 提供的产品和服务,为参赛提供了稳定的数据底座。其中,UModel 作为云监控 2.0 的核心建模基础,提出基于图模型的统一可观测数据建模范式,不仅解决了传统可观测系统中“数据孤岛”、“语义割裂”、“建模复杂”等痛点,还为 AI 原生运维(AIOps)、智能根因分析、跨域关联等高级能力提供了结构化、可推理的数据底座,是阿里云为 AI 时代打造的运维世界本体,让可观测系统从“被动响应”走向“主动认知与优化”。


本次大赛的技术深度也赢得了学术界的关注,其技术逻辑与实验环境已获得中科院等知名高校机构认可,并被正式引入相关科研课题实践,为 AIOps 产业长期发展储备高质量人才。


阿里云智能资深技术专家、云原生应用平台负责人周琦表示,AIOps 编程挑战赛希望以大模型与 AI 技术为新起点,帮助开发者开启在 Operation Intelligence 广阔赛道上的探索,将传统依赖经验的‘老中医式’运维转变为智能化的问题解决能力,实现从被动响应向主动预测的升级感谢各位参赛选手的创意和创新,和阿里云一同推动 AIOps Agent 的发展,创造智能运维的未来。


大赛中沉淀的技术标准与人才生态将持续赋能企业向 AI 原生演进。阿里云将以云监控 2.0 为核心智能运维体系,帮助企业在 AI 时代以更智能、更高效、更低成本的方式构建全栈可观测体系


点击此处,回顾决赛现场。

相关文章
|
2月前
|
消息中间件 监控 物联网
领航智联时代:阿里云 MQTT+Kafka 车/物联网实时数据分析解决方案
该解决方案深度整合移动端/设备端连接利器 MQTT 与大数据流处理核心引擎 Kafka,为车联网及物联网行业提供高可靠、高性能、极简运维的数据处理链路。
386 147
|
2月前
|
人工智能 缓存 Shell
Qoder 发布首个自进化的智能体:看 Quest 如何重构了 Quest
Quest 是一款实现真正自主编程的AI代理,通过Agentic上下文管理、精简Bash工具链、Spec→Coding→Verify闭环及动态Skills系统,让AI端到端交付可运行产物。它不依赖人工调试,支持自进化与多模型协同,专为未来大模型而设计。(239字)
Qoder 发布首个自进化的智能体:看 Quest 如何重构了 Quest
|
6月前
|
消息中间件 人工智能 运维
事件驱动重塑 AI 数据链路:阿里云 EventBridge 发布 AI ETL 新范式
“一个简单的数据集成任务,开始时总是轻松愉快的,但随着业务扩展,数据源越来越多,格式越来越乱,整个数据链路就会变得一团糟。”陈涛在演讲中指出了当前 AI 数据处理的普遍困境。扩展难、运维难、稳定性差,这三大挑战已成为制约 AI 应用创新和落地的关键瓶颈。针对这些痛点,在2025云栖大会期间,阿里云重磅发布了事件驱动 AI ETL 新范式,其核心产品 EventBridge 通过深度集成 AI 能力,为开发者提供了一套革命性的解决方案,旨在彻底改变 AI 时代的数据准备与处理方式。
642 46
|
3月前
|
消息中间件 人工智能 运维
从这张年度技术力量榜单里,看见阿里云从云原生到 AI 原生的进化能力和决心
12 月 9 日,由 InfoQ 发起的“2025 中国技术力量榜单”评选结果正式揭晓,阿里云云原生应用平台凭借在 AI 原生应用领域的系统性布局与技术创新实践,一举揽获七项核心大奖,标志着阿里云在云原生领域的深厚积累,正在系统性进化为 AI 原生的全栈领导力。
|
4月前
|
存储 人工智能 运维
UModel 数据治理:运维世界模型构建实践
阿里云推出 UModel 统一建模框架,将实体、关系、数据、知识、行动融为一体,为大模型提供可推理、可交互的运维世界模型,推动可观测从‘被动响应’迈向‘主动优化’的新阶段。
759 51
|
6月前
|
人工智能 监控 Kubernetes
稳定支撑大规模模型调用,携程旅游的 AI 网关实践
为了进一步提升服务水平和服务质量,携程很早就开始在人工智能大模型领域进行探索。而随着工作的深入,大模型服务的应用领域不断扩大,公司内部需要访问大模型服务的应用也越来越多,不可避免的就遇到了几个问题,我们自然就会想到使用网关来对这些服务接入进行统一管理,并增加各种切面上的流量治理功能。
562 66
|
2月前
|
Cloud Native Java 编译器
阿里云可观测联合 Datadog 发布 OpenTelemetry Go 自动插桩工具
面对 Go 语言长期缺乏成熟自动插桩方案的困境,阿里云联合 Datadog 推出 OpenTelemetry Go 编译时插桩工具,无需修改代码,只需 ./otel-go build,即可为 HTTP、gRPC、Redis 等组件自动注入链路追踪与指标采集能力。现已开源,欢迎试用!
283 32
|
2月前
|
缓存 负载均衡 Go
RTP-LLM 在相关性大模型中的推理优化最佳实践
本文介绍淘宝搜索如何通过RTP-LLM框架,创新实现大Batch调度、批次内KV缓存复用及MoE Kernel动态调优,成功落地3.5B MoE大模型相关性计算,在严苛500ms延迟约束下保障性能与稳定性。
RTP-LLM 在相关性大模型中的推理优化最佳实践