开放、协同,2025 云栖大会“操作系统开源与 AI 进化分论坛”精彩回顾

简介: 唯有通过生态开放与技术共享,才能加速 AI 技术的普惠与产业化落地。

9 月 24 日,由阿里云联合龙蜥社区举办的“操作系统开源与 AI 进化”分论坛(以下简称为“分论坛”)圆满落幕。本次分论坛上,来自阿里云、清华大学、AMD、货拉拉、OPPO、英特尔、中兴通讯、安谋科技等资深专家,围绕智驾领域 AI 性能增强、原生安全、智能运维等维度上的突破性实践,创新技术的探索实战,以及多元算力基础设施协同新范式展开深度探讨。大会首日,线下展区人潮涌动,超千人参与互动,分论坛现场座无虚席。


(图/分论坛及展区现场)


会议伊始,阿里云智能集团研发副总裁、龙蜥社区理事长马涛做开场致辞,与现场嘉宾深入探讨了操作系统如何成为 AI 革命的战略支点。他指出,随着开源大模型参数量突破万亿级,操作系统已从传统资源管理者进化为 AI 原生创新的使能者:通过异构融合技术,高效调度 CPU/GPU/DPU;通过动态调度技术,实时感知负载变化,使系统资源利用最大化;通过可信机密计算技术,构建全栈安全体系;通过推理框架以及分布式缓存系统演进,让 AI 推理更加高效敏捷。同时,马涛表示,作为龙蜥社区理事长单位,阿里云始终秉持“共建、共治、共享”的理念,推动社区及操作系统在 AI 浪潮中的开源与开放。唯有通过生态开放与技术共享,才能加速 AI 技术的普惠与产业化落地。未来,期待阿里云及龙蜥社区联合高校、企业与开发者,构建从芯片到系统、从推理到应用的全栈 AI 能力,打造具有全球影响力的 AI 创新生态。


(图/阿里云智能集团研发副总裁、龙蜥社区理事长马涛)


面向“云+AI”的趋势,新一代为 AI Infra 增强的操作系统底座应当如何演进?阿里云智能集团高级技术专家张金利带来了全新的 Alibaba Cloud Linux 4 (以下简称“Alinux 4”)产品的介绍和技术解读。Alinux 4 面向下一代云计算数据中心和 AI 基础设施设计,落实了“开源生态合作倡议”技术规范,遵循龙蜥社区最新一代技术路线演进,支持 13 年的生命周期。Alinux 4 基于上游 6.6 版本内核,研发了超过 70 个特性,推出了 AI 增强套件、智能助手、操作系统控制台、内生安全体系等多个重磅技术模块,不仅带来更友好的系统开发运维体验,还在智算业务上提升了数倍性能。未来,Alinux 4 会与龙蜥社区 AI 技术规划深度绑定,围绕 System for AI 和 AI for System 命题,在多个技术领域展开开源研发,并持续引领 AI 开源生态、推动 Agent 生态演进、降低模型服务的训练推理成本。


(图/阿里云智能集团高级技术专家张金利)


由于在算力和带宽两方面的明显优势,传统大模型推理架构往往以 GPU 为中心进行设计。然而,随着 GPU 利用率逐渐逼近瓶颈,进一步降低推理成本需要开拓新的优化路径。清华大学副教授章明星在《从同构走向分离的大模型推理系统》报告中介绍了两种具体优化思路,一是以存换算的 Mooncake 架构;二是以存强算的 KTransformers 系统。此外,章明星就更多异构分离可能性与现场嘉宾做了深度探讨。目前,相关项目均已开源,并获得广泛关注。


(图/清华大学副教授章明星)


龙蜥社区历经 5 年发展,生态合作伙伴遍布全球。OpenAnolis 与 AMD 紧密协作,围绕开放生态构建与系统兼容性持续创新,推动国产开源操作系统与全球硬件架构的融合发展,加速本地生态的成熟与全球协同。会上,AMD 公司全球副总裁 Raghu Nambiar 详细介绍了双方在内核优化、平台适配、性能调优等方面的深入合作。


(图/AMD 公司全球副总裁 Raghu Nambiar)


智驾场景作为 AI 场景重要的方向之一,来自智驾场景的技术需求随着业务的发展而呈现快速增长的态势。阿里云智能集团产品专家钱君从操作系统、编译优化、AI profling 视角出发,给出智驾场景在数据读取、数据处理、模型训练方向上的产品解决方案,进一步增强智驾方案整体的竞争力。


(图/阿里云智能集团产品专家钱君)


智能化升级:SysOM运维护航货拉拉容器化平稳转型实践。会上,阿里云智能集团产品专家周絮、货拉拉容器架构师陈宗舒就围绕 SysOM 为核心的操作系统服务的全新升级以及 SysOM 在辅助货拉拉容器转型中保障业务稳定性的实践进行了详细的介绍。周絮介绍了阿里云操作系统控制台在通算与智算双场景融合浪潮中,通过通算场景的“深化”与智算场景的“突破”双轮引擎打造 SysOM 2.0 的最新升级以及特性。而陈宗舒分享了货拉拉业务在容器化上的演进历程中的经验,以及 SysOM 是如何支撑其在转型中解决系统延时、抖动、夯机等问题的最佳实践。


(图/左:阿里云智能集团产品专家周絮,右:货拉拉容器架构师陈宗舒)


在大模型产业化的过程中,基于云的“模型即服务”(MaaS)已成为企业高效应用 AI 的核心模式。OPPO 高级安全架构师杨洋聚焦行业如何协同推进 AI 及 LLM 基础设施的可信性与透明性建设,并结合 OPPO 在构建端云一体化机密计算能力方面的实践历程,通过技术创新与生态协作,共同解决 AI/LLM 应用在可信性、透明性与可运维性上面临的挑战。阿里云智能集团高级技术专家刘煜堃则从支持机密计算的 IaaS 到 MaaS 产品矩阵,再到赋能社区的众多开源工作,系统地介绍了阿里云的完整解决方案。此外,刘煜堃表示阿里云一直致力于为用户提供高安全等级、可信、可靠、可验证的基础设施,让智能计算安心无忧。


(图/左:OPPO 高级安全架构师杨洋,右:阿里云智能集团高级技术专家刘煜堃)


值得一提的是,本次会上,英特尔数据中心与人工智能集团首席工程师宋川、龙蜥社区安全联盟主席龙勤、OPPO 高级安全架构师杨洋、阿里云智能集团高级技术专家刘煜堃等 4 位嘉宾,共同出席并发布了《Confidential MaaS 实践指南》,该指南深入阐述如何从 0 到 1 构建可验证的 AI 推理环境,并覆盖不同场景的架构方案。


(图从左至右:英特尔数据中心与人工智能集团首席工程师宋川、阿里云智能集团高级技术专家刘煜堃、OPPO 高级安全架构师杨洋、龙蜥社区安全联盟主席龙勤)


在文生图领域,DiT 推理性能高度受限于算力资源,而推理优化手段(如缓存机制、模型量化)通常以牺牲精度为代价。从客户视角来看,精度损失对用户体验具有直接影响。阿里云智能集团技术专家林育德基于电商行业的实际需求,分享了 Diffusion Transformer  推理优化攻克 DiT 技术商业化应用的关键瓶颈。


(图/阿里云智能集团技术专家林育德)


在 AI 技术加速企业迈入智能经济新纪元的背景下,全球开源生态正加速重构。中兴通讯开源生态总工王长金深度解析了中兴通讯智算产品开源基金会的发展路径,涵盖联盟/组织协作机制与社区项目的演进趋势,并系统分享开源社区建设的实战经验与关键方法论。


(图/现场照片中兴通讯开源生态总工王长金)


人工智能 (AI) 工作负载的加速增长,正在重塑云与数据中心基础设施的需求。效率、可扩展性以及跨生态系统的开放协作,已成为全球创新的关键驱动力。会上,安谋科技基础设施业务线总监侯科鑫以《扩展智能基础设施 —— Arm 引领云与 AI 数据中心新纪元》为题进行了分享。她重点阐述了 Arm Neoverse 平台如何赋能新一代面向 AI 的智能数据中心。Neoverse 具备行业领先的性能与能效比,以及坚实的生态系统支持,旨在加速各类云环境中的 AI 工作负载。她还强调,Arm 以开放、协作的方式支持开源的龙蜥操作系统等项目,彰显了针对异构计算构建协同且优化的软件生态系统的价值。演讲最后,她与现场在座嘉宾共同探讨了云计算的演进之路,以及如何携手 Arm 共同探索行业未来机遇。


(图/安谋科技基础设施业务线总监侯科鑫)

—— 完 ——

相关文章
|
7月前
|
人工智能 运维 安全
|
7月前
|
消息中间件 人工智能 开发框架
火速收藏!2025 云栖大会 AI 中间件议程看点全公开(附免费报名通道)
2025 云栖大会“云智一体 · 碳硅共生”的主题下,9月26日,云栖小镇D1-3馆「AI 中间件论坛」将聚焦 AI 时代中间件的技术演进与创新实践,带来 AI 开发框架、消息队列、事件驱动架构及 API 网关等关键技术在 AI 领域的前沿技术探索、最新产品发布、落地实践经验。
465 54
|
7月前
|
人工智能 运维 安全
聚焦 AI 应用基础设施,云栖大会 Serverless AI 全回顾
2025 年 9 月 26 日,为期三天的云栖大会在杭州云栖小镇圆满闭幕。随着大模型技术的飞速发展,我们正从云原生时代迈向一个全新的 AI 原生应用时代。为了解决企业在 AI 应用落地中面临的高成本、高复杂度和高风险等核心挑战,阿里云基于函数计算 FC 发布一系列重磅服务。本文将对云栖大会期间 Serverless+AI 基础设施相关内容进行全面总结。
|
7月前
|
人工智能 Cloud Native 中间件
【云栖大会】AI原生、AI可观测、AI Serverless、AI中间件,4场论坛20+议题公布!
2025 年 9 月 24 日至 26 日,杭州·云栖小镇,4 大论坛、20+ 主题分享,从云原生到 AI 原生,我们诚邀您共赴企业智能化升级浪潮之巅。
|
机器学习/深度学习 人工智能 自然语言处理
一周AI最火论文 | 新冠病毒数据开源,Kaggle发布新冠病毒挑战赛
一周AI最火论文 | 新冠病毒数据开源,Kaggle发布新冠病毒挑战赛
723 0
|
6月前
|
消息中间件 人工智能 安全
云原生进化论:加速构建 AI 应用
本文将和大家分享过去一年在支持企业构建 AI 应用过程的一些实践和思考。
1643 67
|
7月前
|
人工智能 安全 中间件
阿里云 AI 中间件重磅发布,打通 AI 应用落地“最后一公里”
9 月 26 日,2025 云栖大会 AI 中间件:AI 时代的中间件技术演进与创新实践论坛上,阿里云智能集团资深技术专家林清山发表主题演讲《未来已来:下一代 AI 中间件重磅发布,解锁 AI 应用架构新范式》,重磅发布阿里云 AI 中间件,提供面向分布式多 Agent 架构的基座,包括:AgentScope-Java(兼容 Spring AI Alibaba 生态),AI MQ(基于Apache RocketMQ 的 AI 能力升级),AI 网关 Higress,AI 注册与配置中心 Nacos,以及覆盖模型与算力的 AI 可观测体系。
1466 76
|
6月前
|
人工智能 运维 Kubernetes
Serverless 应用引擎 SAE:为传统应用托底,为 AI 创新加速
在容器技术持续演进与 AI 全面爆发的当下,企业既要稳健托管传统业务,又要高效落地 AI 创新,如何在复杂的基础设施与频繁的版本变化中保持敏捷、稳定与低成本,成了所有技术团队的共同挑战。阿里云 Serverless 应用引擎(SAE)正是为应对这一时代挑战而生的破局者,SAE 以“免运维、强稳定、极致降本”为核心,通过一站式的应用级托管能力,同时支撑传统应用与 AI 应用,让企业把更多精力投入到业务创新。
712 30
|
6月前
|
设计模式 人工智能 自然语言处理
3个月圈粉百万,这个AI应用在海外火了
不知道大家还记不记得,我之前推荐过一个叫 Agnes 的 AI 应用,也是当时在 WAIC 了解到的。
722 2
|
6月前
|
存储 人工智能 NoSQL
AI大模型应用实践 八:如何通过RAG数据库实现大模型的私有化定制与优化
RAG技术通过融合外部知识库与大模型,实现知识动态更新与私有化定制,解决大模型知识固化、幻觉及数据安全难题。本文详解RAG原理、数据库选型(向量库、图库、知识图谱、混合架构)及应用场景,助力企业高效构建安全、可解释的智能系统。

推荐镜像

更多
下一篇
开通oss服务