Arm公布了Neoverse V1和N2服务器芯片平台的「性能数据」,处理能力比上一代增强了40% -50% .
数据中心工作负载和互联网流量的需求呈指数级增长,这就需要新的方案——要满足这些需求,同时还要减少当前和预期的耗电量增长。
但Arm表示,目前运行的各种工作负载和应用程序意味着,「一刀切」的计算方法不是最终解决办法。这是对使用x86架构的「英特尔」和「AMD」嘲讽。
Neoverse V1:性能提升50%
50%的性能提升,1.8倍的矢量工作负载范围的提升,比N1高出4倍的机器学习工作负载。
这就是Neoverse V1的性能表现。
V1是Arm新的性能优先计算层中的第一个。V1为芯片给了合作伙伴更多灵活性为更依赖于 CPU 性能和带宽的应用程序构建计算,同时也给了SoC设计灵活性。
Arm奔着「性能第一」的设计理念设计V1,想要建立一个有史以来「最广泛」的微架构,容纳更多的飞行指令支持高性能和百万兆等级运算。
Arm表示,这种宽而深的架构ーー加上可伸缩矢量扩展(SVE)ーー使V1在单核性能和代码寿命方面处于领先地位,并为SoC设计者提供实施的灵活性。
这是HPC计算的发展方向,可以参考SiPearl和ETRI的HPC SoCs.
Neoverse N2:首款Arm V9微架构
第二代的N系列平台Neoverse N2的目标是覆盖从云到边缘计算的所有设备。
几周前,Arm刚推出了Armv9架构,以满足各个领域对于专用处理器的需求。Neoverse N2平台也是「第一个」基于Armv9架构的平台的芯片,在安全性、能效和性能方面都有改进。
与N1相比,Neoverse N2提供了40%的单线程性能,仍然保持与Neoverse N1相同的功率和单位面积效率。除此之外,Neoverse N2的也拥有更好的扩展性。
Neoverse N2平台单线程性能和工作效率方面均具有行业领先的性能,从而降低了用户的总体拥有成本。Neoverse N2是第一个具有SVE2功能的平台,该功能是Armv9功能,可显着提升云到边缘的性能。
对于机器学习、数字信号处理、多媒体和5G系统等领域来说,SVE2有更好的性能,也更易于编程,以及还继承了SVE的可移植性优势。
Arm也玩凡尔赛?
分析人士指出,V1对于高性能计算机来说也是一个强劲的开端;而通过N2,人们还会发现「单线程设计」的性能也能如此高。
总之,Arm正在努力提升其在计算市场的竞争力。
Arm基础设施业务高级VP Chris Bergey介绍,Arm自10年前就开始研发具有竞争力的服务器芯片,基于此种设计的芯片或将于今年年底或明年年初上市。
Arm表示,Neoverse CMN-700是业内最先进的网状互连系统,可以释放 Neoverse V1和 N2平台的性能和功率效益。它是制造高性能V1和N2芯片的关键元件,并支持更高的核心计数和缓存内存。
随着「摩尔定律」的终结,方案供应商正在寻求专业化的处理方法。自Neoverse系列平台发布以来,启用专业化处理一直是一个焦点,Arm预计这些功能更新将加速这一趋势。
去年9月,Arm公布了V1和N2,但是没有公布性能,这次则公布了效能功耗比,所有权的总成本收益,以及采用这些设计的合作伙伴。
Arm列举了一些客户的测试数据:
美国芯片制造商Marvell透露,其基于N2的Octeon系列网络解决方案将在2021年底开始抽样筛检,性能比上一代Octeon芯片高3倍。
印度电子和信息技术部(MeitY)宣布,将与 SiPearl 和 ETRI 一起为V1的国家级高性能计算项目颁发许可证。
甲骨文计划在Oracle云基础设施中采用Ampere Altra CPU,作为各种工作负载的价格/性能领先者。
基于Arm的亚马逊AWS Graviton2继续以稳定的增长和区域扩张迅速扩大其 EC2的覆盖范围。
阿里云刚刚测试了即将推出的阿里云 ECS Arm 实例,展示出DragonWell JDK 性能提高了50%.
腾讯正在硬件测试和软件支持方面进行投资,这将使其能够在云应用中采用Neoverse技术。Arm高级VP Bergey表示,测试结果表明Arm的设计具有很高的效能功耗比。
此外,还有英伟达的Grace,但现在还有很多「未解之谜」——Grace所采用的Arm处理器没有公布,Arm也没有透露Grace是否应用了Neoverse设计。
Arm高级VP Bergey表示,这些客户的「背书」只是「冰山一角」,不应该让创新者在性能和效率之间「二选一」。
Arm助你「二者兼得」。
不得不说,Arm也是凡尔赛的高手。
除了多家客户「背书」,分析人士也很看好V1和N2的表现。
Linley集团首席分析师Linley Gwennap也表示,第三方数据很能说明问题,他说:
AMD已经超过N1:「AMD 最新的 Epyc 处理器在几乎所有测试中都优于最快的 Neoverse N1芯片,优势很大,尽管 Arm 芯片拥有更多的内核,即使对 TDP 进行了调整,这两种芯片的效能功耗比也大致相同。Arm所谓的的优势在于合成的基准,这种基准最好能够跨越64个或更多的内核,这并不能代表 Phoronix 测量的真实工作量。我估计AMD Zen 3在单线程应用程序上领先N1 60% .」
「如果你根据Arm的数据进行N1比较和项目,在单线程(扩展)工作负载方面,N2仍然比 Zen 3落后20% 。根据 Arm 的说法,N2的功率比它的性能提高得多,因此 N2的功率效率实际上更低(V1的功率效率更低)。因此,如果 AMD 在效能功耗比上与N1匹配,N2也不会让 Arm 在这个指标上领先。总之,在 Arm 在单线程性能方面达到同一水平之前,它将仅限于扩展工作负载。而且,除非它能证明自己在实际应用中的效能功耗比优势,否则它的主要卖点就是更低的价格。」