【阅读原文】戳:AI网络新生态ALS发起成立,信通院、阿里云、AMD等携手制定互连新标准
9月3日,在2024 ODCC开放数据中心大会上,阿里云联合信通院、AMD等十余家业界伙伴发起AI网络互连开放生态ALS(ALink System)。ALS产业生态支持开放的国际主流UALink协议,旨在解决AI网络纵向扩展(Scale-Up)中的超高速、超大带宽等技术难题,为下一代智算网络打造开放的、统一的标准规范。
图丨ALS(ALink System)产业生态正式发布
随着AI大模型的参数量和数据集规模剧增,AI算力资源也需要更高效地互连,以满足低延迟、高吞吐的推理和训练需求。通常,智算网络通过GPU服务器之间的横向扩展(Scale-Out),以及GPU服务器内的纵向扩展(Scale-Up)来实现。其中,纵向互连是直接提升AI芯片协同计算效率的关键。
在Scale-Up网络中,相较于私有协议NVLink技术,UALink协议以极简设计、开放生态等特性而备受瞩目。在开放数据中心委员会ODCC指导下,信通院、阿里云、AMD、华勤技术、新华三、浪潮信息、楠菲微电子、奇异摩尔、芯潮流等18家国内外头部机构联合成立ALS(ALink System,加速器互连系统)产业生态,横跨国内外GPU芯片、互连芯片、服务器整机硬件、云计算等产业领域。ALS支持UALink协议,成为业界首个支持UALink成立的产业生态。
依托于ODCC(开放数据中心委员会)下设的ALS工作组,生态成员们将聚焦解决AI场景Scale-Up互连系统的行业发展和规范问题,推动Scale-Up互连系统标准统一建设,打造下一代AI互连网络软硬件系统。目前,ALS已形成从协议到芯片、从硬件设备到软件平台的系统体系,在ALS-D数据面支持UALink,在ALS-M管控面提供统一接口规范和管控软件平台。
图丨ALS技术架构图
“下一代智算网络需要采用更高效的思路来构建,基于UALink协议的加速器互连系统ALS,是阿里云与合作伙伴对于高度集成、高性能的AI算力集群系统建设的最新探索。ALS将坚持开放技术和生态建设,与上下游伙伴紧密合作,帮助更多AI Infra技术创新从ALS生态中孕育成长起来。”阿里云副总裁、云网络产品线负责人祝顺民表示。
阿里云一直致力于国际开放标准的建设,据了解,阿里云也是CXL、UCIe、SONiC等多个国际互连技术组织的创始成员。今年5月,阿里云还成为超以太网联盟(UEC)技术咨询委员会中唯一的中国公司成员。
我们是阿里巴巴云计算和大数据技术幕后的核心技术输出者。
获取关于我们的更多信息~