“先导杯”上的三张面孔,照亮了国产AI生态的未来

简介: 2025年,中科曙光携手产业链发布国内首个AI计算开放架构,并推出全球首款640卡超节点,推动国产智算从架构走向落地。人才短缺成生态发展瓶颈,而“先导杯”六年来以“教学训赛”模式,连接产业与高校,培养具备实战能力的AI新生力量,填补人才断层,助力中国AI生态迈向自主可控新阶段。

9月初的2025世界智能产业博览会期间,中科曙光协同AI芯片、AI整机、大模型等20多家产业链上下游企业,共同发布了国内首个AI计算开放架构,被外界解读为国产智算的“安卓模式”。

一个礼拜前的世界互联网大会乌镇峰会期间,中科曙光发布了采用AI计算开放架构的全球首个单机柜级640卡超节点scaleX640,标志着国产智算生态从架构层开放走向了工程级落地。

相比封闭生态,开放的产业生态系统更加复杂,需要更多的开发者参与其中,而人才一直是整个产业的短板。能否培养出产业需要的人才生力军,直接关系到国产AI生态的发展进程。

草蛇灰线,伏脉千里。

时间回到2020年,中科曙光联合国家先进计算产业创新中心和一众知名高校、企业、学术机构共同筹办了第一届先导杯。和常规赛事最大的不同,“以实践为导向”始终是先导杯的鲜明标签,紧跟前沿创新和产业痛点,在高校和产业间搭建了一座桥梁。

刚刚结束的第六届先导杯上,来自三个参与者的故事,终于让外界读懂了中科曙光多年的坚持:并非是一个割裂的赛事,正在用“教学训赛”的综合培养模式,为中国AI产业培养后备力量。

01 “我们要解决人才的断层”
山东科技大学的王威,目前在计算机科学与工程学院参与相关领域的研究工作。在此之前,他拥有国家超算中心多年的工作经历。

横跨产业界和学术界的“两栖”经历,让他对中国AI和高性能计算领域的人才现状,有一种旁人难及的清醒认知。“最大的难点之一,就是人才培养和产业需求之间,存在一个断层。”

王威在采访中多次提及“人才断层”,人工智能和高性能计算日新月异,而多数高校的教学内容还停留在课本上面,与产业界的真实场景严重脱节。结果就是,产业界迫切需要能“直接能够在国产平台上深度参与项目”的人才,高校毕业生却需要“一个很长的学习周期”才能真正上手。

作为第六届“先导杯”ONNX Runtime算子优化赛题的出题人,王威瞄准了“脱节的断层”。

在赛题设计上,王威坦言:不是一道“练习题”,而是产业界公认的一个“硬骨头”。要求参赛学生基于海光DCU和ONNX Runtime推理框架,在确保输出精度满足误差标准的前提下,针对Attention、BatchNormalization、Conv、LeakyReLU、GroupNormalization核心算子进行性能优化。

背后有着双重考量。

第一是考验学生们的“复合能力”。绝不是简单的编程任务,直接把负载均衡、显存压力、通信瓶颈等技术壁垒抛给了学生。

参赛学生不能再像过去那样只停留在书本概念上,必须打通一条完整的技术链路:首先要把“计算机体系结构中所学的核心知识”真正用上;其次要具备在国产软硬件生态上调试的“工程能力”;最后还要在高强度的试错和优化中,磨炼出解决复杂问题的系统思维。

第二是关乎未来的“职业启蒙”。在“自主可控”的战略下,发展国产AI生态已是必然,但生态的繁荣,归根结底靠的是“人”。

作为高性能计算领域的研究者,王威深知底层优化工作的“枯燥”,“可能三年才能入门,五年才刚刚有感觉。”把真实的产业难题交给学生,希望他们从过去“站在教科书外看概念”,变成“直接调试产业难题的人”,认识到国产AI生态的瓶颈和机会,进而“主动去探索”“深入去学习”。

让王威印象深刻的是,“有时候凌晨一两点,学生们还在问问题”,“去年参加先导杯的本科生,比赛结束后毅然选择攻读高性能计算方向的研究生”,“不少学生参加比赛后,找到了努力的方向”……

在国内的高校中,像王威这样的“布道者”还有很多,他们用源自内心深处的热爱,在学生们心中埋下了投身国产AI生态的种子。当越来越多的种子生根、发芽、开花、结果,曾经制约产业繁荣的人才断层,将被一批批具备工程实操力、系统思维的新生力量“填平”。

02 “打了场从零开始的硬仗”
山西大学的大二学生王嘉宇,是王威老师特别提到的一位选手。在第六届“先导杯”的决赛入围名单中,对比诸多名校的硕士乃至博士团队,刚读大二的王嘉宇无疑是个特例。

因为底层系统人才缺口较大,且存在人才培养标准不一、教育资源分布不均等问题,先导杯在2024年首次面向本科生开放报名,并创新引入了区域赛模式,面向西北、东北等地区开赛。

来自中西部高校的王嘉宇团队,没有被“相对有限的技术资源”束缚,用实打实的成绩证明了先导杯推动教育公平、赋能多元人才的价值。

大多数同学跟着学校课程按部就班时,王嘉宇就主动报名参加了学校的“超算队”。虽然日常训练使用的是学校所能提供的早期算力资源(例如英伟达V100),正是这份来之不易的机会,为王嘉宇打开了迈向超算世界的第一扇门,锻造了在比赛中面对全新平台时的适应力和冲刺力。

王威老师设计的ONNX Runtime算子优化赛题,对王嘉宇团队来说,不亚于是一场从零开始的“硬仗”。

“尽管中科曙光提供的文档和接口兼容性很高,迁移过程并没有想象中艰难,在比赛开始时还是走了一些弯路。由于硬件差异,需要针对海光DCU做更精细的调整,结合算子原理和硬件参数综合优化,导致早期的性能表现不太理想。”

初期的不顺利,并没有吓退王嘉宇团队。

他们花了很长时间学习中科曙光提供的培训课程,在线上积极和其他同学沟通,在技术社区内找资料,遇到不懂的问题就向出题老师请教,乃至整个国庆假期都在实验室“刷性能”。最终找到了算子性能优化的正确路径:“我们发现性能瓶颈更多来自访存而非计算,重新定义了warp大小,并尝试使用warp shuffle优化attention中的归约性能……”

整个采访过程中,王嘉宇每每提到第一次把attention、卷积跑通的细节,言辞中都难掩心中的兴奋劲儿。在他看来,比赛的意义不在名次,在于一次次“啃硬骨头”的过程,一点点去推敲每个性能指标背后的逻辑,看到性能指标不断被刷新,有一种“升级打怪”的快感。

也让我们见证了这支年轻团队强大的自驱力:没有因“平台不熟悉”止步,而是将挑战视为学习的机会,并在比赛过程中形成了问题建模、性能分析、参数迭代、算子验证的工程能力。

王嘉宇团队的故事不会是个例,折射出的是国产AI生态加速成熟的缩影:当先导杯为中西部高校学生搭建起通向前沿技术的舞台,他们能够近距离接触国产智算平台和产业真实问题,在真实的工程环境中验证理论、打磨能力,会有更多潜藏的年轻力量被看见。

03 “国产生态需要我们参与”
如果说王嘉宇是凭借兴趣和自驱力扎进来的“初生牛犊”,国防科技大学的研二学生朱天赐,则是一个“身在局中”的“准工程师”。国防科大的熏陶、“天河超算”的骄傲,在他心中种下了“使命导向”的担当。

早在本科阶段,朱天赐就做过一款手语识别应用,在比赛中拿到了不错的名次,限于算力和数据集的瓶颈,最终没有实现推广应用。那段经历让他意识到:没有智能算力的土壤,应用将无法真正扎根。

不同于王嘉宇从零开始的启蒙,朱天赐作为队长参加了GMRES和ONNX两道赛题的角逐,想要深入了解国产AI生态的真实痛点。

“之前在学校课程学的是碎片化的知识,知道什么是体系结构、并行计算、内存带宽等概念,就像是零件盒里的螺丝、齿轮、弹簧,并没有组装成能够运行的机械。通过先导杯的比赛,第一次把碎片化的知识,变成了解决实际问题的系统化能力。”

朱天赐遇到的第一个难题是优化“矩阵向量乘”算子,一个看似基础但极度考验体系结构理解的任务。

由于“矩阵向量乘”算子的性能瓶颈在于访存,海光DCU的Wavefront是64线程,和英伟达的32线程不同,意味着以前的优化习惯、经验参数不再适用,需要重新思考数据如何分块、访存如何对齐、调度如何设计。

为了解决这些问题,朱天赐和队友们一遍遍跑实验、画访存路径、调tile size、做规约策略对比。有时候性能曲线不达标,就从硬件特性倒推数学计算、从数学表达式反推访存行为、从访存行为再反推并行策略……“纯理论不会直接带来性能提升,真正能提升性能的,是把理论转换成工程路径的能力”。

“硬核”的比赛过程,让朱天赐对国产AI生态有了更深刻的认知:国产算力平台的性能成熟度超出了预期,而且上手门槛比较低,但体系还不够完善,仍需更多开发者参与和打磨。

亲自上阵填补“缺口”经历,悄然影响了朱天赐的“自我定位”:以前,他更多站在知识体系的外环,作为旁观者学习别人怎么做;现在,意识到自己正处在国产AI生态的前线,是需要主动“补位”的那群人。

谈到毕业后的职业规划时,朱天赐坚定表示:将从事算子优化、编译优化等方面的工作,为国产AI生态的繁荣添一块砖。

04 写在最后
过去十年,中国的AI生态解决了“有没有”的问题。未来十年,问题将变成——“谁来用、谁会用”。算力、架构、模型都可以通过技术迭代逐步补齐,唯有人才,是决定生态上限的“不可替代变量”。

先导杯的价值,在于把产业最真实的需求、最难啃的技术点、最具挑战性的任务,提前放到了年轻人面前,让他们在最初的职业启蒙阶段就认识到:国产AI生态不是某一家厂商、某一所高校的战役,而是一场面向未来的长期工程,需要更多“敢打硬仗”的建设者加入。

有理由相信,最终改变国产AI生态曲线的,不是某一代架构、某一次发布会,而是被点燃的年轻力量。

相关文章
|
8天前
|
人工智能 安全 开发者
解构AI时代的“深圳答案”:以硬实力构建“护城河”
2025年,深圳以“昇腾+光明实验室+华为”协同模式,打造国产AI算力生态。不同于追逐应用热点,深圳聚焦底层突破,构建从芯片到应用的全栈自主链条,通过政企联动、产学研协同,形成“技术攻关—场景验证—迭代优化”闭环,推动算力高效利用与产业深度融合,为全球AI发展提供安全可控的“中国方案”。
75 15
|
15天前
|
人工智能 安全 调度
当“超节点”成为算力新秩序,openEuler重构数智基础设施
随着AI迈向规模化应用,大模型算力需求激增,传统架构难以为继。超节点应运而生,打破“算力孤岛”,实现资源统一调度。openEuler携手产业伙伴,打造全球首个面向超节点的操作系统,推动国产系统从“替代”走向“引领”。2025年,操作系统大会释放强信号:AI与算力深度融合,openEuler 24.03 LTS SP3将于年底上线,2026年或成商业化元年。通过全局资源抽象、异构融合、低时延通信等能力,操作系统正成为智能时代的“神经中枢”。数千企业、数万开发者共建生态,openEuler装机量将破1600万套,加速AI普惠落地,重塑全球算力新格局。
93 11
|
2月前
|
人工智能 小程序 5G
读懂5G新通话:可能是AI落地千行万业的首个全民级场景
5G新通话融合AI与DC数据通道,打破传统语音局限,实现“听说看触”多模态交互。用户拨打热线即可在通话中挂号、咨询、共享屏幕,服务直达指尖。从客服到医疗、助老、外贸,通话正变为集沟通、操作、服务于一体的“生活入口”。2025年,超70款终端支持,6000万用户已体验。通话即服务,时代已变。
291 10
|
安全 JavaScript Docker
Agent Skills技术协议与开源实现,让大模型拥有“即插即用”技能
Anthropic推出Agent Skills协议,通过模块化技能封装提升大模型智能体的专业能力。ModelScope开源项目MS-Agent已实现该协议,支持技能的动态加载、自主执行与安全沙箱运行,推动智能体能力的可组合与可扩展发展。
525 28
|
17天前
|
人工智能 自然语言处理 搜索推荐
深度解读:Geo优化“两大核心+四轮驱动”方法论的落地执行细节
在AI驱动的数字营销新时代,传统SEO面临重构。于磊老师首创“两大核心+四轮驱动”Geo优化方法论,以人性化内容与交叉验证构建可信生态,融合EEAT原则、结构化内容、精准关键词及权威引用,助力企业实现高效获客与可持续增长。
247 16
|
22天前
|
消息中间件 存储 负载均衡
【高可用】什么是异地多活、同城容灾?
异地多活与同城容灾均为提升系统高可用的分布式架构。前者实现跨地域数据中心实时同步与故障切换,保障全球服务连续性;后者聚焦同城内快速容灾,通过高速网络实现低延迟、高可靠的数据同步与负载均衡,适用于对延迟敏感的业务场景。
79 11
|
7天前
|
数据采集 弹性计算 供应链
包年包月、按量付费和抢占式实例有什么区别?阿里云ECS付费类型如何选择?
阿里云ECS提供三种付费模式:包年包月适合长期稳定使用,价格优惠且支持备案;按量付费按小时计费,灵活但成本较高,适合短期或突发业务;抢占式实例价格低至1折,但可能被释放,仅推荐用于无状态应用。根据业务需求选择合适模式可优化成本与稳定性。
63 20
|
24天前
|
SQL 分布式计算 大数据
【跨国数仓迁移最佳实践8】MaxCompute Streaming Insert:大数据数据流写业务迁移的实践与突破
本系列文章将围绕东南亚头部科技集团的真实迁移历程展开,逐步拆解 BigQuery 迁移至 MaxCompute 过程中的关键挑战与技术创新。本篇为第八篇,MaxCompute Streaming Insert:大数据数据流写业务迁移的实践与突破。 注:客户背景为东南亚头部科技集团,文中用 GoTerra 表示。
260 38
|
24天前
|
关系型数据库 数据库 数据安全/隐私保护
使用Docker和docker-compose部署SonarQube的流程
使用Docker和docker-compose部署SonarQube提供了一种快速启动并运行代码质量分析工具的方法。它易于管理,对系统的配置依赖小,而且可以很容易地进行微服务架构的整合。通过上述步骤,您可以确保一个SonarQube的稳定、可重复的部署流程,其可以轻松地搬移到其他环境,以实现开发、测试和生产的一致性。
114 13
|
22天前
|
NoSQL 关系型数据库 Apache
Apache Doris 登顶 RTABench —— 实时分析领域的性能王者
Apache Doris 在最新 RTABench 实时分析榜单中登顶,性能达 ClickHouse 的6倍、PostgreSQL 的30倍、MongoDB 的100倍。依托 MPP 架构、列式存储、Pipeline 引擎与智能优化器,Doris 在多表关联、实时查询等场景表现卓越,成为实时分析新标杆。
128 12
Apache Doris 登顶 RTABench —— 实时分析领域的性能王者

热门文章

最新文章