“算力中国·年度重大成果”通过全球领先性、技术创新性、产业带动性等维度的专业评审,集中展现了我国在人工智能、数据中心、云计算及高性能计算领域的突破性进展。本次成果凭借首创的算网融合架构、并行推理优化技术及稳定性评估体系,攻克了国产GPU集群在通信效率、推理调度和系统稳定性方面的三大核心难题,该技术方案为算力应用提供了可复制、可推广的实践模式,为AI产业化落地提供了关键支撑。
打破“算力孤岛”,筑牢自主算力底座
当前国产GPU产业呈现多厂商生态繁荣态势,多数算力中心采用分散建设模式,形成孤立的小规模集群,难以支撑千亿参数级大模型的训练与高并发推理需求。
基于国产异构GPU云平台关键技术与系统的创新成果,阿里云实现了大规模异构GPU集群下的算网融合架构、并行推理优化技术、云平台稳定性技术,成功构建业内首个万卡混合异构算力云平台,实现多GPU节点间通信性能提升20%、大模型推理吞吐量增长150%、故障定位效率提升42.7%。
当前,该成果已持续在各行业落地应用,累计支撑百余个项目实践,成功服务于教育、科研、互联网、金融、能源、政务、交通等业务场景:
- 教育科研:智能教学平台与科研计算场景。
- 金融科技:智能风控与高频交易系统。
- 能源电力:设备预测性维护与智能调度。
- 政务交通:城市大脑与智慧政务系统。
阿里云将联合产业伙伴共建开放生态,推动国产AI芯片与软件栈的协同创新,持续输出安全可靠、高效智能的算力服务,为千行百业的数字化转型与智能化升级提供坚实算力底座,全面支撑中国数字经济高质量发展。