ARM 推出全新 CPU 和 GPU:首次基于 Armv9 指令集,性能显著提升

简介: ARM 推出全新 CPU 和 GPU:首次基于 Armv9 指令集,性能显著提升

5 月 25 日晚,ARM 推出了新一代 CPU 和 GPU,包括其旗舰产品 Cortex-X2 和 Cortex-A710 CPU 以及 Mali-G710 GPU,新款 CPU 和 GPU 均基于全新的 Armv9 架构。Armv9 指令集于今年 3 月底发布,被称为「ARM 十年来最大的革新与进步」。这次发布的 CPU 和 GPU 是首批使用 Armv9 指令集的芯片,这意味着其性能将有大幅提升,并且具备安全性和 AI 特性。

大多数消费者可能并不熟悉手机或电脑中的 ARM 内核,但事实上 ARM 的设计——尤其是将强大的高性能内核和节能高效的内核相结合的 big.LITTLE 技术,在安卓手机中非常普遍。这意味着 ARM 此次发布的 CPU 和 GPU 将可能影响 2022 年最好的安卓手机。


重磅发布三款 CPU,性能能效显著提升

Arm 今年推出了三款面向移动设备和客户端的新一代微体系结构:旗舰级 Cortex-X2 内核,以 Cortex-A710 形式亮相的 A78 后续产品,还有名为 Cortex-A510 的全新小核心yy.pngCortex-X2 是 Arm Cortex-X 定制计划的一部分,该计划允许合作伙伴帮助设计特定用例的专用内核。Cortex-X2 是去年 Cortex-X1 的继任者,其性能相比 Cortex-X1 有望提高 16%。

Cortex-A710 是 Cortex-A78 的后续产品,ARM 表示其能效相比 A78 有 30% 的提升,性能提升 10%。

不过,ARM 此次芯片升级并未局限于性能内核。在 Cortex-A55 诞生四年后,ARM 首次引入了新的 “LITTLE” 高效内核 Cortex-A510,用于替代自 2017 年推出以来主要用于手机端的 Cortex-A55 设计。ARM 表示 Cortex-A510 将带来最大的性能飞跃:性能提升 30%,能效提升 20%。

除了三款 CPU 以外,ARM 此次还公布了新一代 CPU 集群组合方式。

yy.png

与 ARM 8.2 相比,新一代集群组合(一个 Cortex-X2、3 个 Cortex-A710 内核、4 个 Cortex-A510 内核)的性能将出现大幅提升:峰值性能提升 30%(得益于 Cortex-X2),整体效率提升 30%(得益于 Cortex-A710),「LITTLE」性能提升 35%(得益于 Cortex-A510)。


GPU 升级,覆盖低中高端产品线

在 CPU 更新之外,ARM 还推出了三款新型 GPU:旗舰产品 Mali-G710,中端产品 Mali-G510 和入门级 Mali-G310。

yy.png

在高端产品方面,Mali-G710 是 Mali-G78 的直接继承者,旨在实现较为简单直接的迭代改进:ARM 的架构师能够基于 Mali GPU 实现最高性能。新款 GPU Mali-G710 将游戏性能提升了 20%,能效提升 20%。

Mali-G510 是 2019 年 Mali-G57 的后继产品,是 ARM 中端产品的重大升级,相较于上一代产品实现了极大的性能和能效提升(性能提升 100%,能效提升 22%)。

而新款 Mali-G310 是基于 Valhall 的新型低端入门级产品,代表了基于 Bifrost 的 Mali-G31 的多代架构升级,且瞄准了以低面积效率为重点的市场和其他嵌入式市场,如智能电视。

结语

ARM 此次发布为广泛的用例提供了多种芯片设计。例如计算机可能更依赖于 Cortex-X2 处理器和独立的 GPU 解决方案,智能手机则较依赖 ARM 的 CPU 集群和 Mali-G710 GPU,此外还有使用 Cortex-A510 和 Mali-G310 的智能手表。

新的 ARM 设计出现在手机或设备上还需要一段时间:ARM 仍然需要先将设计交给合作伙伴,然后由合作伙伴制造出半导体产品(通常在年底宣布),之后这些芯片才能进入手机制造环节。

因此,新款 ARM CPU 和 GPU 设计出现在手机设备中可能要等到 2022 年初了,这还是在全球半导体产品短缺不会进一步推迟明年产品的假设下。但ARM 的最新 CPU 和 GPU 设计仍然是智能手机未来发展的一次令人兴奋的预演。

相关实践学习
基于阿里云DeepGPU实例,用AI画唯美国风少女
本实验基于阿里云DeepGPU实例,使用aiacctorch加速stable-diffusion-webui,用AI画唯美国风少女,可提升性能至高至原性能的2.6倍。
相关文章
|
1天前
|
机器学习/深度学习 并行计算 图形学
CPU、GPU、TPU、NPU等到底是什么?
CPU、GPU、TPU、NPU等到底是什么?
|
1天前
|
缓存 Linux Go
一次性构建出多CPU指令集的 Docker 镜像
本文介绍了使用 Docker Buildx 构建跨平台 Docker 镜像的流程。首先确保系统为 Ubuntu 22.04,安装 Docker 和相关依赖。然后配置 Docker Buildx,编写 Go 程序和 Dockerfile。接着,创建构建脚本 `build.sh` 自动化构建并推送镜像到 Docker Hub。运行此脚本将为不同平台(如 amd64, arm64)构建并推送镜像。最后,在 Docker Hub 可查看构建结果,并可在其他系统上测试镜像。
37 3
|
1天前
|
人工智能 并行计算 PyTorch
【PyTorch&TensorBoard实战】GPU与CPU的计算速度对比(附代码)
【PyTorch&TensorBoard实战】GPU与CPU的计算速度对比(附代码)
58 0
|
1天前
|
机器学习/深度学习 存储 并行计算
CPU 和 GPU到底有啥区别?
【5月更文挑战第10天】
26 2
CPU 和 GPU到底有啥区别?
|
1天前
|
机器学习/深度学习 并行计算 TensorFlow
TensorFlow与GPU加速:提升深度学习性能
【4月更文挑战第17天】本文介绍了TensorFlow如何利用GPU加速深度学习, GPU的并行处理能力适合处理深度学习中的矩阵运算,显著提升性能。TensorFlow通过CUDA和cuDNN库支持GPU,启用GPU只需简单代码。GPU加速能减少训练时间,使训练更大、更复杂的模型成为可能,但也需注意成本、内存限制和编程复杂性。随着技术发展,GPU将继续在深度学习中发挥关键作用,而更高效的硬件解决方案也将备受期待。
|
1天前
|
人工智能 芯片 异构计算
台积电董事长预测:未来15年每瓦GPU性能提升1000倍,GPU晶体管数破万亿!
台积电董事长预见到未来15年内GPU性能每瓦提升1000倍,晶体管数量将破万亿,展示半导体行业激动人心的前景。这将增强GPU计算能力,但同时也带来制造工艺复杂性、散热管理和能效提升的挑战。3D集成技术有望解决部分问题,但需克服技术与经济障碍。
28 5
台积电董事长预测:未来15年每瓦GPU性能提升1000倍,GPU晶体管数破万亿!
|
1天前
|
人工智能 芯片 异构计算
GPU震撼发布:性能飙升,功耗惊人,液冷成新宠?
Blackwell推出新一代GPU,性能比H100提升5倍,浮点运算速度惊人,但最高1200W功耗需液冷散热。产品线包括B100、B200和GB200超级芯片,后者结合72核CPU,计算性能达40petaflops,内存384GB。新NVLink技术助力GB200构建NVL72系统,可处理27万亿参数的AI模型。
21 1
|
1天前
|
存储 机器学习/深度学习 并行计算
阿里云服务器X86计算、Arm计算、GPU/FPGA/ASIC、高性能计算架构区别
在我们选购阿里云服务器的时候,云服务器架构有X86计算、ARM计算、GPU/FPGA/ASIC、弹性裸金属服务器、高性能计算可选,有的用户并不清楚他们之间有何区别,本文主要简单介绍下不同类型的云服务器有何不同,主要特点及适用场景有哪些。
阿里云服务器X86计算、Arm计算、GPU/FPGA/ASIC、高性能计算架构区别
|
1天前
|
机器学习/深度学习 存储 弹性计算
阿里云GPU服务器价格多少钱?2024年阿里云GPU服务器价格配置及性能测评
2024年阿里云GPU服务器是一款高性能的计算服务器,基于GPU应用的计算服务,多适用于视频解码、图形渲染、深度学习、科学计算等应用场景。阿里云GPU服务器具有超强的计算能力、网络性能出色、购买方式灵活、高性能实例存储等特点。 阿里云提供了多种配置的GPU服务器,包括gn6v、gn6i、vgn6i-vws和gn6e等,这些服务器配备了不同型号的GPU计算卡、不同规格的内存和存储空间,可以满足不同用户的计算需求。同时,阿里云还为新用户提供了特惠价格,包年购买更是低至3折起,使得用户可以更加经济地购买到高性能的GPU服务器。
181 0
|
1天前
|
存储 Java 程序员
cpu与指令集
cpu与指令集
32 0