全球首款7nm GPU和CPU同时发布,AMD要逆天!

简介: AMD宣布AWS会采用EPYC服务器芯片,双方已经达成合作。

AMD宣布AWS会采用EPYC服务器芯片,双方已经达成合作。

盼了又盼,AMD的发布会终于召开了。

11月7日消息,在美国旧金山,AMD召开了名为Next Horizon的大型发布会,会上发布了之前就已经“走漏风声”的全球首款7nm GPU,更让粉丝惊喜的是,一同发布的还有第二代EPYC霄龙,这是全球第一个7nm服务器处理器。

TB1THganZfpK1RjSZFOXXa6nFXa.jpg

EPYC霄龙代号为“Rome”(罗马),它基于全新的Zen 2架构,单颗拥有最多64个物理核心,128个线程,是第一代的两倍,功耗和性能都有大幅提升。Rome EPYC中还设有一个I/O裸片,放在中央,用来控制输入和输出。除了采用7nm制程外,它还是第一个支持PCIE 4.0技术的处理器,因此带宽通道也翻了几倍,可以提升加速器性能。

根据AMD公布的数据,Rome EPYC的性能比第一代翻了一番,浮点性能翻了两番,这样的升级可以说是突破很大了。

AMD的7nm GPU则是很早就出现在大众眼前,在今年6月的Computex 2018上,AMD展出过7nm Radeon Vega GPU,着实让粉丝们激动了一回。而今天发布的则是Radeon Instinct MI60和Radeon Instinct MI50,二者都基于7nm工艺的升级版Vega架构核心,集成了132亿个晶体管。上一代的14nm Vega 晶体管数量为125亿个,前者比后者增加了6.4%晶体管数量增加,面积却减少了,上一代的核心面积为484平方毫米,新一版的则是331平方毫米,小了31.6%。在同等的功耗之下,7nm Vega性能提升25%,同等频率下,功耗却降低了50%。Radeon Instinct还搭配32GB的 HBM2显存,显存带宽能够达到1TB/s。同时,这也是全球第一款支持PCI-E 4.0的显卡,AMD表示,双向带宽64GB/s,此外,借助带宽高达100GB/s的Infinity Fabric系统总线,可支持四路GPU同时运行。它的扩展性也很不错,双路性能提升了99%,四路提升298%,八路提升664%。在加速功能上,MI60 FP64双精度浮点最高为7.4TFlops,INT整数最高118Tops,FP32单精度最高14.7TFlops。

此外,AMD宣布AWS会采用EPYC服务器芯片,双方已经达成合作。

未来,AMD还会推出第一个做出7nm+升级版工艺的Zen 3,以及5nm工艺的Zen 4,看来以后AMD的发展方向是很稳了。抢先一步做出全球第一款7nm CPU和GPU,AMD的竞争对手英伟达和英特尔是否感到压力扑面而来了呢?

相关实践学习
在云上部署ChatGLM2-6B大模型(GPU版)
ChatGLM2-6B是由智谱AI及清华KEG实验室于2023年6月发布的中英双语对话开源大模型。通过本实验,可以学习如何配置AIGC开发环境,如何部署ChatGLM2-6B大模型。
相关文章
|
弹性计算 人工智能 Serverless
阿里云ACK One:注册集群云上节点池(CPU/GPU)自动弹性伸缩,助力企业业务高效扩展
在当今数字化时代,企业业务的快速增长对IT基础设施提出了更高要求。然而,传统IDC数据中心却在业务存在扩容慢、缩容难等问题。为此,阿里云推出ACK One注册集群架构,通过云上节点池(CPU/GPU)自动弹性伸缩等特性,为企业带来全新突破。
|
9月前
|
存储 弹性计算 网络协议
阿里云服务器ECS通用算力型u2a实例,CPU采用AMD EPYC处理器,睿频最高3.7 GHz
阿里云ECS通用算力型u2a实例搭载AMD EPYC处理器,睿频高达3.7GHz,基于CIPU架构,网络与存储突发带宽最高25Gbps,I/O性能强、延迟低。支持多种云盘及IPv4/IPv6,适用于中小型数据库、APP服务等场景,性价比高,官网价降低9%-22%,是中小企业上云优选。
1023 0
|
监控 异构计算
Jetson 学习笔记(八):htop查看CPU占用情况和jtop监控CPU和GPU
在NVIDIA Jetson平台上使用htop和jtop工具来监控CPU、GPU和内存的使用情况,并提供了安装和使用这些工具的具体命令。
1661 0
|
并行计算 PyTorch 算法框架/工具
融合AMD与NVIDIA GPU集群的MLOps:异构计算环境中的分布式训练架构实践
本文探讨了如何通过技术手段混合使用AMD与NVIDIA GPU集群以支持PyTorch分布式训练。面对CUDA与ROCm框架互操作性不足的问题,文章提出利用UCC和UCX等统一通信框架实现高效数据传输,并在异构Kubernetes集群中部署任务。通过解决轻度与强度异构环境下的挑战,如计算能力不平衡、内存容量差异及通信性能优化,文章展示了如何无需重构代码即可充分利用异构硬件资源。尽管存在RDMA验证不足、通信性能次优等局限性,但该方案为最大化GPU资源利用率、降低供应商锁定提供了可行路径。源代码已公开,供读者参考实践。
1380 3
融合AMD与NVIDIA GPU集群的MLOps:异构计算环境中的分布式训练架构实践
|
机器学习/深度学习 人工智能 并行计算
CPU和GPU的区别
【10月更文挑战第14天】
|
机器学习/深度学习 人工智能 缓存
GPU加速和CPU有什么不同
【10月更文挑战第20天】GPU加速和CPU有什么不同
984 1
|
人工智能 自然语言处理 文字识别
MinerU-大语言语料处理神器,CPU/GPU均可跑,开源免费“敲”好用
在7月4日举行的WAIC 2024科学前沿主论坛上,书生·浦语2.5正式发布,面向大模型研发与应用的全链条工具体系同时迎来升级。
MinerU-大语言语料处理神器,CPU/GPU均可跑,开源免费“敲”好用
|
9月前
|
缓存 人工智能 算法
不同业务怎么选服务器?CPU / 内存 / 带宽配置表
本文详解了服务器三大核心配置——CPU、内存、带宽,帮助读者快速理解服务器性能原理。结合不同业务场景,如个人博客、电商、数据库、直播等,提供配置选择建议,并强调合理搭配的重要性,避免资源浪费或瓶颈限制。内容实用,适合初学者和业务选型参考。
1257 0
|
9月前
|
存储 消息中间件 缓存
从纳秒到毫秒的“时空之旅”:CPU是如何看待内存与硬盘的?
在数据爆炸的时代,如何高效存储与管理海量数据成为系统设计的核心挑战。本文从计算机存储体系结构出发,解析B+树、LSM树与Kafka日志结构在不同数据库中的应用与优化策略,帮助你深入理解高性能存储背后的原理。
283 0