今天,小鹏汽车宣布在内蒙古乌兰察布建成中国最大的自动驾驶智算中心“扶摇”,用于自动驾驶模型训练。
“扶摇”基于阿里云智能计算平台,算力可达600PFLOPS(每秒浮点运算60亿亿次),将小鹏自动驾驶核心模型的训练速度提升了近170倍。
小鹏汽车董事长、CEO何小鹏表示:随着自动驾驶模拟训练的需求变化,我们需要一个强大的本地+云端的算力来支持。我非常有信心和阿里云在一起合作,我们能够更快更强去实现自动驾驶的研发。小鹏汽车期待,与阿里云一起携手共进,共创未来出行时代的美好明天。
01 自动驾驶难在哪?
数据驱动是自动驾驶发展的公认方向,也让自动驾驶模型训练成为一头“吃算力”的巨兽。
目前,市面上大部分自动驾驶汽车都还停留在L2水平,自动驾驶系统只能提供智能加减速、行车稳定等辅助性帮助,想要实现L3甚至是L4级别的自动驾驶,算法模型的成熟度变得至关重要。
自动驾驶的视觉检测、轨迹预测与行车规划等算法模型,有赖于机器学习海量数据集,但算力的不足让研发速度仍远远赶不上数据量增长的速度。随着传感器的进一步增加,算力的挑战越来越大。
近年来,专用于机器学习的AI智算成为发展最快的一种算力形式,国内外顶尖科技公司开始兴建智算中心,以应对行业中快速增长的AI智算需求。
02 扶摇智算中心
在乌兰察布,小鹏汽车与阿里云合作建成一个算力规模达600PEFLOPS的自动驾驶专用智算中心“扶摇”,来进一步提高模型训练的效率。
“扶摇”通过更低成本实现了更强算力:
首先,对GPU资源进行细粒度切分、调度,将GPU资源虚拟化利用率提高3倍,支持更多人同时在线开发,效率提升十倍以上。
在通讯层面,端对端通信延迟降低80%至2微秒。整体计算效率上,实现了算力的线性扩展。
存储吞吐比业界20GB/s的普遍水准提升了40倍。
阿里云机器学习平台PAI提供了模型训练部署、推理优化等AI工程化工具。
同时,“扶摇”也是更绿色低碳的智算中心,结合乌兰察布当地天然的气候优势,采用风冷、AI调温、模块化设计等绿色技术,可实现全年超过80%时间全新风运行,年平均PUE小于1.2。
如今,“扶摇”支持小鹏自动驾驶核心模型的训练时长从7天,缩短至1小时内,大幅提速近170倍。此外,“扶摇”还正用于城市NGP智能导航辅助驾驶功能的算法模型训练。