恭喜!阿里云震旦异构平台荣获MLPerf™推理V1.1边缘计算场景冠军

简介: 近日,全球权威AI基准评测MLPerf公布了最新Inference(推理) V1.1榜单。阿里云震旦异构平台以稳定、强大的软硬协同优化能力,在边缘计算场景封闭组提交的所有三项性能结果均取得了业界第一的好成绩,再续其在通用硬件平台和基准软件基础上软件调优的辉煌。

image.png

近日,全球权威AI基准评测MLPerf公布了最新Inference(推理) V1.1榜单。阿里云震旦异构平台以稳定、强大的软硬协同优化能力,在边缘计算场景封闭组提交的所有三项性能结果均取得了业界第一的好成绩,再续其在通用硬件平台和基准软件基础上软件调优的辉煌。


image.png

MLCommons


MLPerf™是目前全球最具影响力的国际AI性能测试基准,用于测试机器学习模型和相应的软硬件系统协同工作性能,为行业从业人员衡量系统性能提供详细的数据参考。MLCommons组织每年交叉发布2次MLPerf™训练性能和2次MLPerf™推理性能榜单。



相对于五个月前发布的推理性能V1.0榜单,此次V1.1榜单上的绝大部分系统都取得了5-30%性能提升,其中部分系统甚至达到了2倍性能提升,这也证明了软件栈优化在AI算力优化领域的巨大潜力


封闭组(Close Division)测试要求数据提交方使用相同AI模型和优化器,这对于实际用户评测AI计算系统本身的性能具备很强的对比和参考意义,因此一直是MLPerf™榜单上角逐最激烈及主流厂商最关注的领域。


此次阿里云正是针对封闭组的严格要求,基于目前主流通用GPU硬件,以离线场景单卡性能成绩作为基准点,提交了边缘计算场景下目标检测模型的全部三项性能测试数据。震旦平台对软件栈底层算子进行了超大规模、多层次的自动融合优化,大幅提高GPU算力利用率,并有效减少内存带宽占用,在所有的三个项目中,均超越了截止目前V1.1优化结果在内的业界最佳性能,最高达到14%以上。而相比较此前推理V1.0测试结果,震旦平台优化后的测试数据更是比业界最佳性能数据分别提升了21.8% (T4)、13.1% (A10) 和2.1% (A100)。



image.png



在五个月前的推理榜单V1.0中,阿里云主打数据中心侧开放组场景,来展示震旦平台的AI全栈自动优化能力。震旦对图像分类项的ResNet50模型进行高效、大空域的网络架构搜索和知识蒸馏重训练,从而得到一个最佳适配目标GPU、且符合测试精度要求的超轻量AI模型。而此次推理V1.1榜单中,震旦通过边缘计算封闭组场景的目标检测项SSD-MobileNet模型来展示其另一个方面的优化潜力:即在同样的AI模型下,震旦通过大规模、多层次的底层算子软硬协同优化能力,大幅实现模型的性能提升。


阿里云提交的性能数据也同样证明,震旦平台独有的大规模、多层次全栈自动调优能力,不仅适用于多种AI场景下的算法模型,也为多代通用GPU架构带来灵活的适配能力。此外,震旦平台的这种优化能力,也为未来各种AI模型在不同厂商的加速硬件架构上平滑迁移和部署打下了坚实基础。


本次阿里云提交成绩所使用的SSD-MobileNet模型,是目前轻量级目标检测领域最为领先和流行的模型之一,在视频图像分析领域业务有着广泛的应用,包括自动驾驶,菜鸟物流和智能交通出行等。



阿里巴巴作为MLCommons的创始会员,一直积极参与MLPerf™性能测试。2019年11月发布的MLPerf™推理性能测试0.5版本中,阿里巴巴平头哥AI芯片含光800在封闭优化规则下Resnet50基准测试中获得单芯片性能第一。技术驱动的阿里云在基础设施技术创新和前沿科技上不断突破,坚持软硬件协同创新,为云计算、人工智能和物联网提供更加先进的基础设施,给全球消费者带来更好的体验。


阅读原文

相关文章
|
1天前
|
存储 监控 Apache
查询提速11倍、资源节省70%,阿里云数据库内核版 Apache Doris 在网易日志和时序场景的实践
网易的灵犀办公和云信利用 Apache Doris 改进了大规模日志和时序数据处理,取代了 Elasticsearch 和 InfluxDB。Doris 实现了更低的服务器资源消耗和更高的查询性能,相比 Elasticsearch,查询速度提升至少 11 倍,存储资源节省达 70%。Doris 的列式存储、高压缩比和倒排索引等功能,优化了日志和时序数据的存储与分析,降低了存储成本并提高了查询效率。在灵犀办公和云信的实际应用中,Doris 显示出显著的性能优势,成功应对了数据增长带来的挑战。
查询提速11倍、资源节省70%,阿里云数据库内核版 Apache Doris 在网易日志和时序场景的实践
|
11天前
|
人工智能 边缘计算 Kubernetes
阿里云边缘容器云帮助AI推理应用快速落地
2024全球分布式云大会·北京站,阿里云徐若晨演讲内容分享
22 0
|
19天前
|
存储 机器学习/深度学习 网络协议
阿里云企业级ARM计算规格族特点、适用场景及收费标准与活动价格参考
阿里云企业级ARM计算规格族是阿里云继X86计算、异构计算、弹性裸金屈服务器、超级计算集群之后推出的全新架构云服务器,ARM计算规格族有通用型实例规格族g8y、计算型实例规格族c8y、通用型实例规格族g6r等。下面是阿里云企业级ARM计算规格族特点、适用场景及最新收费标准和活动价格参考。
阿里云企业级ARM计算规格族特点、适用场景及收费标准与活动价格参考
|
21天前
|
存储 机器学习/深度学习 网络协议
阿里云高性能计算实例规格族有哪些?各自特点、适用场景介绍
阿里云高性能计算是的阿里云服务器ECS的架构之一,高性能计算实例规格族主要应用于各种需要超高性能、网络和存储能力的应用场景,例如人工智能、机器学习、科学计算、地质勘探、气象预报等场景。高性能计算实例规格族有高性能计算优化型实例规格族hpc8ae、高性能计算优化型实例规格族hpc7ip、计算型超级计算集群实例规格族sccc7等。下面是阿里云高性能计算实例规格族特点、适用场景介绍。
阿里云高性能计算实例规格族有哪些?各自特点、适用场景介绍
|
28天前
|
存储 人工智能 搜索推荐
阿里云佘俊泉:边缘云场景的探索与机遇
2024全球分布式云大会·北京站,阿里云演讲《创新涌现,边缘云场景的探索与机遇》
47 8
阿里云佘俊泉:边缘云场景的探索与机遇
|
2月前
|
Java 开发工具
阿里云灵积平台Java SDK调用教程
开通阿里云灵积服务并创建API-KEY,添加Java依赖`dashscope-sdk-java`版本2.11.0。示例代码展示如何使用SDK进行多模态对话,调用`MultiModalConversation`进行交互,并打印结果。测试结果显示输出对一张图片的描述。参考链接提供通义千问VL快速入门指南。
152 0
|
2月前
|
存储 SQL 数据管理
阿里云数据库 SelectDB 内核 Apache Doris 如何基于自增列满足高效字典编码等典型场景需求|Deep Dive 系列
自增列的实现,使得 Apache Doris 可以在处理大规模时展示出更高的稳定性和可靠性。通过自增列,用户能够高效进行字典编码,显著提升了字符串精确去重以及查询的性能。使用自增列作为主键来存储明细数据,可以完美的解决明细数据更新的问题。同时,基于自增列,用户可以实现高效的分页机制,轻松应对深分页场景,有效过滤掉大量非必需数据,从而减轻数据库的负载压力,为用户带来了更加流畅和高效的数据处理体验。
|
2月前
|
缓存 运维 监控
应用研发平台EMAS 常见问题之用华为的推送界面阿里云收不到如何解决
应用研发平台EMAS(Enterprise Mobile Application Service)是阿里云提供的一个全栈移动应用开发平台,集成了应用开发、测试、部署、监控和运营服务;本合集旨在总结EMAS产品在应用开发和运维过程中的常见问题及解决方案,助力开发者和企业高效解决技术难题,加速移动应用的上线和稳定运行。
385 2
|
2月前
|
边缘计算 专有云 虚拟化
阿里云神龙在智慧办公场景下的特点
阿里云神龙在智慧办公场景下的特点

热门文章

最新文章