权威 AI 测试 MLPerf 公布最新榜单:阿里巴巴拿下多项算力第一

简介: 4 月 7 日,权威 AI 基准评测组织 MLPerf 公布了最新一期推理性能榜单。MLPerf 由图灵奖得主 David Patterson 于 2018 年发起,每年组织全球 AI 训练和 AI 推理性能测试并发榜,已成为业界最主流标准之一。

4 月 7 日,权威 AI 基准评测组织 MLPerf 公布了最新一期推理性能榜单。MLPerf 由图灵奖得主 David Patterson 于 2018 年发起,每年组织全球 AI 训练和 AI 推理性能测试并发榜,已成为业界最主流标准之一。

image.png

北京时间 4 月 7 日,MLCommons 发布最新 MLPerf 榜单

本次榜单重点更新了面向数据中心和边缘计算的场景,以及最新的 MLPerf Tiny 0.7 测试榜单。阿里云联合平头哥、达摩院等在数据中心、边缘计算、物联网领域斩获多项第一。

image.png

在当前激烈的数据中心和边缘计算场景下,各厂商及机构基于硬件加速的成绩差距并不大,竞争主要聚焦在模型软硬协同优化方面。榜单显示,阿里云磐久服务器脱成为 MLPerf 有史以来首个获得纯 CPU 推理性能最高的 ARM 架构服务器,且在数据中心和边缘侧该类别的总体性能均为第一。

image.png

MLPerf 2.0 DatacenterCPU-Only 推理性能数据对比

据悉,阿里云震旦异构加速平台利用模型优化工具 SinianML 来进行用于 AI 任务的神经网络架构搜索和压缩,以及最佳算子实现。在保证达到基准测试精度目标同时,能得到远高于标准 ResNet50 v1.5 的计算效率。

此外,在 MLPerf Tiny 场景,阿里云通过大规模深度算子融合和针对平头哥玄铁 RISC-V 微架构的极致优化,从而能够大大提高 CPU 算力利用率,实现软硬协同优化。

Tiny 场景是 MLPerf 近年新增的性能测试分类。有别于 Datacenter 等大规模、高算力的情景,Tiny 聚焦于低功耗、高性价比的 IoT 场景,考验在日益广泛的 IoT 智能应用场景下的软硬件性能和优化能力。

在此次公布的 MLPerf Tiny 0.7 性能数据榜单中,阿里云震旦异构计算加速平台通过编译和软硬件一体化创新优化,结合达摩院在语音和视觉等机器智能的算法知识,基于平头哥自研 RISC-V 玄铁 C906 处理器在所有 4 项 Benchmark 的 CPU 性能数据均取得第一,在满足模型精度要求的同时创造了 RISC-V 架构在该 AI 基准测试榜单上的最好成绩。

image.png

MLPerf Tiny 0.7 推理性能数据对比

“高度集成的专业化 AI 芯片对应用场景限制很多,我们希望研发出更通用的软硬协同加速平台来发挥 AI 应用的价值,”阿里云异构计算首席科学家张伟丰博士表示。

了解更多软件开发与相关领域知识,点击访问 InfoQ 官网:https://www.infoq.cn/,获取更多精彩内容!

不难发现,MLPerf 正将评测环境更多地向云厂商倾斜,后者已成为 AI 产业的主力军。

目录
相关文章
|
26天前
|
机器学习/深度学习 人工智能 自然语言处理
探索AI在软件测试中的转型力量###
本文深入探讨了人工智能(AI)技术在软件测试领域的应用现状与未来趋势,通过分析AI如何优化测试流程、提高测试效率与质量,揭示了AI赋能下软件测试行业的转型路径。传统测试方法面临效率低、成本高、覆盖率有限等挑战,而AI技术的引入正逐步改变这一格局,为软件测试带来革命性的变化。 ###
|
7天前
|
机器学习/深度学习 人工智能 自然语言处理
自动化测试的新篇章:利用AI提升软件质量
【10月更文挑战第35天】在软件开发的海洋中,自动化测试犹如一艘救生艇,它帮助团队确保产品质量,同时减少人为错误。本文将探索如何通过集成人工智能(AI)技术,使自动化测试更加智能化,从而提升软件测试的效率和准确性。我们将从AI在测试用例生成、测试执行和结果分析中的应用出发,深入讨论AI如何重塑软件测试领域,并配以实际代码示例来说明这些概念。
34 3
|
16天前
|
人工智能 测试技术 Windows
Windows 竞技场:面向下一代AI Agent的测试集
【10月更文挑战第25天】随着人工智能的发展,大型语言模型(LLMs)在多模态任务中展现出巨大潜力。为解决传统基准测试的局限性,研究人员提出了Windows Agent Arena,一个在真实Windows操作系统中评估AI代理性能的通用环境。该环境包含150多个多样化任务,支持快速并行化评估。研究团队还推出了多模态代理Navi,在Windows领域测试中成功率达到19.5%。尽管存在局限性,Windows Agent Arena仍为AI代理的评估和研究提供了新机遇。
36 3
|
20天前
|
机器学习/深度学习 数据采集 人工智能
探索AI驱动的自动化测试新纪元###
本文旨在探讨人工智能如何革新软件测试领域,通过AI技术提升测试效率、精准度和覆盖范围。在智能算法的支持下,自动化测试不再局限于简单的脚本回放,而是能够模拟复杂场景、预测潜在缺陷,并实现自我学习与优化。我们正步入一个测试更加主动、灵活且高效的新时代,本文将深入剖析这一变革的核心驱动力及其对未来软件开发的影响。 ###
|
27天前
|
机器学习/深度学习 人工智能 安全
AI真的能与人类数据科学家竞争吗?OpenAI的新基准对其进行了测试
AI真的能与人类数据科学家竞争吗?OpenAI的新基准对其进行了测试
|
3天前
|
机器学习/深度学习 人工智能 自然语言处理
自动化测试的未来:AI与持续集成的完美结合
【10月更文挑战第39天】本文将探索自动化测试领域的最新趋势,特别是人工智能(AI)如何与持续集成(CI)流程相结合,以实现更快、更智能的测试实践。我们将通过实际代码示例和案例分析,展示这种结合如何提高软件质量和开发效率,同时减少人为错误。
17 0
|
27天前
|
存储 人工智能 Java
将 Spring AI 与 LLM 结合使用以生成 Java 测试
AIDocumentLibraryChat 项目通过 GitHub URL 为指定的 Java 类生成测试代码,支持 granite-code 和 deepseek-coder-v2 模型。项目包括控制器、服务和配置,能处理源代码解析、依赖加载及测试代码生成,旨在评估 LLM 对开发测试的支持能力。
34 1
|
28天前
|
机器学习/深度学习 人工智能 自然语言处理
探索AI在软件测试中的创新应用与实践###
本文旨在探讨人工智能(AI)技术如何革新软件测试领域,提升测试效率、质量与覆盖范围。通过深入分析AI驱动的自动化测试工具、智能化缺陷预测模型及持续集成/持续部署(CI/CD)流程优化等关键方面,本研究揭示了AI技术在解决传统软件测试痛点中的潜力与价值。文章首先概述了软件测试的重要性和当前面临的挑战,随后详细介绍了AI技术在测试用例生成、执行、结果分析及维护中的应用实例,并展望了未来AI与软件测试深度融合的趋势,强调了技术伦理与质量控制的重要性。本文为软件开发与测试团队提供了关于如何有效利用AI技术提升测试效能的实践指南。 ###
|
17天前
|
机器学习/深度学习 人工智能 自然语言处理
探索软件测试的未来:AI与自动化的融合
【10月更文挑战第25天】在本文中,我们将深入探讨软件测试领域正在经历的革命性变化。随着人工智能(AI)和自动化技术的不断进步,传统的测试方法正逐步被更高效、更智能的解决方案所取代。文章将展示如何通过AI增强自动化测试框架,实现更高效的缺陷检测和问题解决。我们将从基础出发,逐步揭示AI在测试用例生成、测试执行和结果分析中的应用,以及这些技术如何帮助团队提高生产力并缩短产品上市时间。
|
1月前
|
人工智能 监控 JavaScript
模拟依赖关系和 AI 是Vue.js测试的下一个前沿领域
模拟依赖关系和 AI 是Vue.js测试的下一个前沿领域
27 1