7nm处理器的优点和缺点

简介:

前段时间,AMD宣布7-nm Epyc x86 CPU和Vega GPU为业界带来了一股新希望,这些芯片将降低高端处理器的成本。这个消息还提供了一个前沿工艺技术收益递减的例子,并引发了对加速器开源代码质量的担忧。
针对《EE Times》日前发布的AMD 7-nm晶片新闻报导,德国的一位科学研究人员哀叹,高端Nvidia V100的价格高达1万美元,使其无法在研究经费使用原则下轻松订购。
英国的一位研究人员则指出,对于欧洲买家来说,动辄超过15,000美元的价格实在让他们吃不消,但英特尔(Intel)和Nvidia的毛利率至少都有63%。
他说:我知道Nvidia打造了十分出色的产品,但......这个(价格)问题只能透过CPU和GPU的市场竞争加剧来解决。AMD、Cavium/Marvell、富士通(Fujitsu)和Ampere等公司请加把劲向前进展......,我们的科学由于正因为目前这样的情况而受折磨。
讨论主题中的另一个人发布了一张图表(下图),显示了随着公司追求更高性能零件,Nvidia GPU的芯片尺寸不断增加。

nvidia

AMD显然也在试图降低其7-nm Epyc x86 CPU的成本,因而在14-nm芯片上建置其内存控制器以及I/O。但AMD新部件的价格竞争还有待观察。如果7纳米产品比预期的更成功,AMD可能会发现自己受到台积电(现为其唯一的7纳米供应商)所能获得的晶圆数量的限制。
在部件首次亮相之前,英特尔宣布将其所有容量都集中在高端设备上,声称它无法满足PC需求的复苏。但总体需求实际上并没有上升;国际数据公司的分析师马里奥·莫拉莱斯说,相反,英特尔可能一直在试图诱使AMD追求低端产品市场。
尽管企业需求稳步提升,PC市场并未见成长中。Morales表示,事实上,中国的桌面计算机和笔记本电脑市场——代表整个PC市场中最大部份,目前正略微下滑。
研究人员看好新的AMD组件引爆价格竞争的潜力。但他们也在Twitter上抱怨GP-GPU的软件状态。他们说,Nvidia的大多数程序代码仍然是专有的,而且,Nvidia和AMD提供的开源程序代码也都不尽如人意。
质量低劣的代码从一开始就是AMD GPU计算软件堆栈的“致命弱点”,一位研究人员表示。
“我很高兴AMD Radeon开源Linux驱动程序实际上包含所有计算组件(与Nvidia相反),”另一位研究人员说。“然后,有缺陷的开源软件仍然禁止广泛采用。”
“请让CUDA成为一个开放的生态系统,其他各方可以为未来的功能提供输入或为CUDA API实现自己的运行时,”英国一位研究人员表示,他指的是Nvidia的GP-GPU软件。
另一位研究人员说:“如果每个人都建置了CUDA,就必须建置CUDA性能模型,而这将会妨碍创新,对于加速来说更糟糕。我们需要一个更能够适应其他处理器公司各种创新的生态系统。”此外,“还需要为Nvidia特定OpenCL扩展添加档案......以及聘请一些人来处理有关其错误追踪器的问题。”
美国的一位研究人员表示,“在客户要求高质量建置开放平行编程标准之后,情况才会改善......而且我们的科学也会受到影响。”
来自AMD、英特尔和Nvidia的几位代表纷纷加入讨论,捍卫各自公司所做的努力。
一家供货商表示,“OpenMP 5.0现已问世,这对GPU运算来说也是非常令人兴奋的。我知道AMD的Greg Rodgers、Nvidia的Jeff Larkin与其他OpenMP工作组在这方面投入许多努力以实现目标。”

7nm的优势不如最初期
在硬件方面,AMD的Epyc和Vega是7-nm节点上的首批现实检查。
台积电在2017年3月表示,与其16FF +节点相比,其工艺可提供高达35%的速度提升或60%的低功耗。然而,AMD仅声称其芯片的速度将比其14纳米产品提高25%或功耗降低50%。
“台积电可能一直在测量像环形振荡器这样的基本设备,我们声称它是真正的产品,”Mark Papermaster在当天接受采访时表示7纳米芯片已经曝光。
“摩尔定律正在放缓,半导体节点更加昂贵,而且我们没有得到我们过去常常得到的频率提升,”他在发布会上的一次谈话中说,称7-nm迁移“是一个粗略的提升,增加了掩模,更多的抵抗和寄生。“
展望未来,使用极紫外光刻(EUV)的7纳米节点将“主要利用效率和一些适度的设备性能机会,”他在采访中说。
对于AMD来说,在标准有机封装上使用7-nm和14-nm芯片混合使用类似于三星转向3D NAND。它通过其他人可能采用的方法为公司留出了成本喘息的空间。

毫无疑问,领先的节点正在呈现历史性挑战。
英特尔目前正在亚利桑那州钱德勒推出一款采用EUV的7纳米晶圆厂,但预计至少在明年年底之前不会有产量。Tirias Research的负责人Jim McGregor表示,即便是英特尔目前的14纳米产量也“高于门槛,但产品差异很大”。

相关实践学习
部署Stable Diffusion玩转AI绘画(GPU云服务器)
本实验通过在ECS上从零开始部署Stable Diffusion来进行AI绘画创作,开启AIGC盲盒。
相关文章
|
2月前
|
程序员 编译器
与浮点 CPU 相比,定点 CPU 的优点和缺点是什么
定点CPU相比浮点CPU,优点在于结构简单、成本低、功耗小,适合处理整数运算;缺点是无法高效处理小数和复杂数学运算,精度受限。适用于对成本和功耗敏感的应用场景。
|
7月前
|
并行计算 算法 C#
C# Mandelbrot和Julia分形图像生成程序更新到2010-9-14版 支持多线程计算 多核处理器
此文档是一个关于分形图像生成器的介绍,作者分享了个人开发的M-J算法集成及色彩创新,包括源代码和历史版本。作者欢迎有兴趣的读者留言交流,并提供了邮箱(delacroix_xu@sina.com)以分享资源。文中还展示了程序的发展历程,如增加了真彩色效果、圈选放大、历史记录等功能,并分享了几幅精美的分形图像。此外,还提到了程序的新特性,如导入ini文件批量输出图像和更新一批图片的功能。文档末尾附有多张程序生成的高分辨率分形图像示例。
|
8月前
|
存储 缓存 物联网
DP读书:鲲鹏处理器 架构与编程(二)服务器与处理器——高性能处理器的并行组织结构、ARM处理器
DP读书:鲲鹏处理器 架构与编程(二)服务器与处理器——高性能处理器的并行组织结构、ARM处理器
347 0
|
8月前
硬件中电感器的重要作用与特性
硬件中电感器的重要作用与特性
57 0
|
编解码
h264和h265编码所需要的处理器性能
h264和h265编码所需要的处理器性能
1366 0
h264和h265编码所需要的处理器性能
|
索引
03ZSTI4-00-501 处理器设计通常包括前任的指令
03ZSTI4-00-501 处理器设计通常包括前任的指令
96 0
03ZSTI4-00-501 处理器设计通常包括前任的指令
|
芯片
74HC595芯片的IO扩展(串转并)实验(包含硬件原理和软件编程解析和代码)
74HC595芯片的IO扩展(串转并)实验(包含硬件原理和软件编程解析和代码)
348 1
74HC595芯片的IO扩展(串转并)实验(包含硬件原理和软件编程解析和代码)
|
存储 缓存 Java
【优化技术专题】「底层架构原理系列」CPU处理器鲜为人知的那些秘密
【优化技术专题】「底层架构原理系列」CPU处理器鲜为人知的那些秘密
407 0
【优化技术专题】「底层架构原理系列」CPU处理器鲜为人知的那些秘密
|
存储 异构计算
FPGA - 7系列 FPGA内部结构之SelectIO -09- 高级逻辑资源之IO_FIFO
FPGA - 7系列 FPGA内部结构之SelectIO -09- 高级逻辑资源之IO_FIFO
393 0
FPGA - 7系列 FPGA内部结构之SelectIO -09- 高级逻辑资源之IO_FIFO