训练时间可缩短50%!阿里云推出自动驾驶模型加速框架

简介: 阿里云推出PAI-TurboX框架,专为自动驾驶领域模型训练与推理加速设计,可提升感知、规划控制及世界模型效率,缩短训练时间50%以上,并已广泛应用于多家车企。

今天,阿里云正式推出面向自动驾驶领域模型的训练、推理加速框架PAI-TurboX。

该框架可提升感知、规划控制乃至世界模型的训推效率,在多个行业模型的训练任务中,PAI-TurboX均可缩短50%的时间。

PAI-TurboX框架,可用于多模态数据预处理、离线大规模模型训练以及实时智驾推理等环节,可为自动驾驶、具身智能等领域提供全面解决方案,目前已应用于多家车企。

在系统侧,PAI-TurboX通过优化CPU亲和性、动态编译、流水线并行等策略,显著提升模型的训练推理效率

在数据侧,PAI-TurboX提出了高性能的DataLoader引擎,并且优化了数据预处理流程和实现了智能训练样本分组,有效提升数据处理效率

此外,PAI-TurboX还提供了算子优化和量化等能力,可进一步减少训练阶段的访存延迟,提升吞吐效率,同时在推理任务中,能在保障精度的同时降低计算开销与内存带宽需求,可实现异构平台下的高性能推理部署。

实测结果显示:

  • 在自动驾驶的3D物体检测模型BEVFusion训练任务中,PAI-TurboX可以将训练时间缩短58.5%

  • 在实时在线矢量化高精地图构建模型MapTR训练任务中,PAI-TurboX可以将训练时间缩短53%

  • 在端到端自动驾驶模型SparseDrive训练任务中,PAI-TurboX 可以在感知模块训练和联合训练两个阶段获得明显的速度提升,相同训练步数下两个阶段可分别缩短51.5%和48.5%

阿里云人工智能平台PAI可提供贯穿AI开发和运维全流程的平台服务。自2016年诞生以来,PAI已累计服务超过10万家企业客户及数百万AI开发者,支撑阿里云百炼、魔搭社区等MaaS服务及社区。



来源  |  阿里云公众号

目录
相关文章
|
11月前
|
数据采集 自动驾驶 Java
PAI-TurboX:面向自动驾驶的训练推理加速框架
PAI-TurboX 为自动驾驶场景中的复杂数据预处理、离线大规模模型训练和实时智能驾驶推理,提供了全方位的加速解决方案。PAI-Notebook Gallery 提供PAI-TurboX 一键启动的 Notebook 最佳实践
|
8月前
|
人工智能 自然语言处理 IDE
模型微调不再被代码难住!PAI和Qwen3-Coder加速AI开发新体验
通义千问 AI 编程大模型 Qwen3-Coder 正式开源,阿里云人工智能平台 PAI 支持云上一键部署 Qwen3-Coder 模型,并可在交互式建模环境中使用 Qwen3-Coder 模型。
1259 109
|
4月前
|
存储 人工智能 分布式计算
阿里云 OpenLake:AI 时代的全模态、多引擎、一体化解决方案深度解析
阿里云徐晟详解OpenLake:构建全模态、多引擎、一体化智能数据体系,融合大数据与AI,支持湖仓一体、Agentic Data及AI搜索,助力企业降本增效、加速AI落地。(239字)
717 2
阿里云 OpenLake:AI 时代的全模态、多引擎、一体化解决方案深度解析
|
9月前
|
弹性计算 编解码 大数据
性价比最高提升50%!阿里云企业级云服务器上新
阿里云ECS云服务器推出全新升级的u2系列实例,包括基于Intel的u2i实例与首个基于AMD的u2a实例,提供企业级独享算力,综合性价比最高提升50%。u2i实例已开放公测,适用于中小型数据库、企业网站建设等场景。同时发布基于AMD的第九代旗舰实例g9ae,性能提升65%,适用于大数据、视频转码等密集型业务。
635 0
|
9月前
|
人工智能 分布式计算 DataWorks
大数据AI产品月刊-2025年7月
大数据& AI 产品技术月刊【2025年7月】,涵盖7月技术速递、产品和功能发布、市场和客户应用实践等内容,帮助您快速了解阿里云大数据& AI 方面最新动态。
|
10月前
|
机器学习/深度学习 人工智能 测试技术
【ICML2025】大模型后训练性能4倍提升!阿里云PAI团队研究成果ChunkFlow中选
近日,阿里云 PAI 团队、通义实验室与中国科学院大学前沿交叉科学学院合作在机器学习顶级会议 ICML 2025 上发表论文 Efficient Long Context Fine-tuning with Chunk Flow。ChunkFlow 作为阿里云在变长和超长序列数据集上高效训练解决方案,针对处理变长和超长序列数据的性能问题,提出了以 Chunk 为中心的训练机制,支撑 Qwen 全系列模型的长序列续训练和微调任务,在阿里云内部的大量的业务上带来2倍以上的端到端性能收益,大大降低了训练消耗的 GPU 卡时。
|
7月前
|
机器学习/深度学习 缓存 自然语言处理
【万字长文】大模型训练推理和性能优化算法总结和实践
我们是阿里云公共云 AI 汽车行业大模型技术团队,致力于通过专业的全栈 AI 技术推动 AI 的落地应用。
2964 39
【万字长文】大模型训练推理和性能优化算法总结和实践
|
10月前
|
数据采集 人工智能 大数据
10倍处理效率提升!阿里云大数据AI平台发布智能驾驶数据预处理解决方案
阿里云大数据AI平台推出智能驾驶数据预处理解决方案,助力车企构建高效稳定的数据处理流程。相比自建方案,数据包处理效率提升10倍以上,推理任务提速超1倍,产能翻番,显著提高自动驾驶模型产出效率。该方案已服务80%以上中国车企,支持多模态数据处理与百万级任务调度,全面赋能智驾技术落地。
1339 0
|
存储 机器学习/深度学习 人工智能
创新场景丨小鹏汽车:端到端智驾真正竞赛在云端
算力上的提前布局,让小鹏汽车在国内率先实现端到端智能驾驶大模型量产上车。小鹏汽车认为,端到端只是开始,不是终局,真正的竞赛正在云端展开,云端大模型才是制胜关键。拥有强大算力的阿里云,支撑小鹏汽车端到端大模型的快速迭代。