Nvidia和AMD显卡是如何制作的

简介: Nvidia和AMD显卡是如何制作的

我们参观了世界上最大的显卡制造商之一,看看魔术是如何发生的。

Perface

对于我这样一个PC硬件发烧友来说,中国无疑是制造业的圣地。所以,当我有机会亲眼见证奇迹时,我立刻收拾行囊,从英国西部那个像夏尔一样的地方出发,穿越6000多英里的距离,来到中国东莞这个被雾霾笼罩的魔多,看看这些技术奇迹是如何诞生的。

就像许多电脑游戏玩家一样,我理所当然地希望我那昂贵、复杂的图形处理器能正常工作,而几乎不去想它是从哪里来的,或是如何到达这里的。但当我有机会亲眼目睹最新一批Nvidia和AMD图形卡在时差还没倒过来的眼前被制造和测试时,我立刻欣然接受了。

是啊,我现在对那些焊接、拧螺丝和测试每一张显卡的工程师们,以及帮助他们完成这项工作的神奇机器有了新的认识。说真的,那些放置组件的小机器人真迷人。我可以整天看着它们…这可能让我更适合在中国的工厂工作,而不是我最初预期的那样。

有许多制造商销售供您游戏乐趣的显卡,但实际组装这些显卡的公司可能比你浏览亚马逊时想象的要少。

我很幸运地参观了一家你可能从未听说过,但很可能使用过其产品的制造工厂。PC Partner自1997年开始作为主板供应商成立以来,一直在推动技术的发展。

第二年,它开始了合同制造业务,并且从未回头。如今,它为众多公司制造产品,如戴尔、AMD、宏碁、三星、蓝宝石、LG、微软,以及自己的品牌:索泰和映众。

在显卡方面,这意味着它同时制造Nvidia和AMD显卡——深入研究就会发现,它们的根源往往来自同一个地方。事实上,PC Partner是AMD显卡最大的合同制造商。虽然我不被允许拍摄正在下线的AMD显卡,所以你只会看到基于Nvidia的索泰显卡。

除了显卡,PC Partner还制造主板、迷你电脑、闪存产品、ATM和销售点设备。数字也非常惊人——仅PC Partner每月就将生产40万张显卡,当你看到这些显卡在到达我们的电脑之前必须经历的每一个过程时,这个数字就显得更加令人印象深刻了。

PC Partner的每一条显卡生产线平均每天可以生产大约4000个单位。但每条生产线并不局限于单一产品——虽然它试图将生产线更换次数限制在每天五次以下,但在高需求时期,生产线的更换次数甚至可能达到这个数字。

这个过程的高度流水线化使得类似显卡之间的切换只需要五分钟,如果从一个小型显卡切换到更大的显卡,最多也只需要15分钟。在制造过程中,从一个完全不同的显卡切换到另一个显卡的周转时间惊人地快。虽然时间就是金钱,但这一切都是值得的。

PC Partner的每一条显卡生产线平均每天可以生产大约4000个单位。但每条生产线并不局限于单一产品——虽然它试图将生产线更换次数限制在每天五次以下,但在高需求时期,生产线的更换次数甚至可能达到这个数字。

这个过程的高度流水线化使得类似显卡之间的切换只需要五分钟,如果从一个小型显卡切换到更大的显卡,最多也只需要15分钟。在制造过程中,从一个完全不同的显卡切换到另一个显卡的周转时间惊人地快。虽然时间就是金钱,但这一切都是值得的。

工厂

东莞工厂的地板是一个严格控制的空间,那里唯一的噪音是制造设备不断的研磨、呼呼声和活塞叹息声。在这座灰色的大建筑的任何一层,每一条不同生产线的许多工作人员都听不到任何人类的噪音。

这是压力环境的产物,在压力环境中,订单必须履行,失败是不可选择的,还是纯粹因为有一群无知的记者在四处游荡——所以尽量忽略他们——我不完全确定。

但生产受到严格控制,制造过程的各个方面都被无数的自动化系统敏锐地观察到,这些系统被输入到一个监控中心。在这里,每一次生产下降,每一个制造错误,都可以被看到,并与前几天、几周或几个月进行比较。

不过,生产并不是工厂里的全部,在生产线准备推出数千张最新的显卡之前,需要进行各种准备测试。但这就是我来的原因,也是我发现自己穿着一件迷人的蓝色防静电外套和一顶相配的帽子站在那里的原因。

制造过程

PC Partner自己不做的一部分过程是创建单独的印刷电路板(PCB)。它有一个设计部门来制定最终布局,但实际制造是外包给其他公司的,裸板是批量到货的,为所有的图形效果做好了准备。

然而,在将任何东西粘在上面之前,每个裸露的PCB都会贴上标签,并设置在一个框架中,该框架可以容纳一对较长的PCB板,也可以容纳四块较小的设计板。它比个人制造更高效,意味着没有显卡单独进入这个世界。

实际过程的第一部分是焊料的丝网印刷。这种粘稠的粘稠物被印在每个裸露PCB的无数接触点上,用于连接后续组件。然后我最喜欢的机器开始工作。

拾取和放置机器是这一过程的精密工件;他们灵活的手指将最微小的组件放置在每块板上,在PCB上以令人眩晕、催眠的高速舞蹈。

这些机器由磁带卷提供,所有单独的部件都连接在磁带卷上。在每条生产线的起点,一组工程师按照特定生产线所需的任何规格组装各个卷筒。

在所有最小的组件都粘在板上后,PCB会经过一个称为回流焊的过程,最终对单元进行烘焙,以确保它们都牢固连接。一旦板冷却,它们就会通过自动光学检查(AOI)机,以100%确保每个微小部件都处于正确的位置。如果它们通过了,PCB就会被翻转过来,这样它们就可以在电路板的另一侧再次经历同样的过程。

这就是真正的GPU被丢弃的神奇时刻发生的时候;当它不再只是一块普通的印刷电路板,上面有几个电阻器和存储芯片,变成一个成熟的图形处理怪物的时候。对我来说,这是这些显卡真正活起来的时候。

但这个过程还没有结束。现在需要安装较大的部件——电容器、电源接头和视频端口——这也是人类真正需要参与的地方。这些部件中的许多都是手工安装的,而不是由拾取和放置机器安装的,然后通过波峰焊机器;在冒泡的熔锡湖中,电路板穿过它们,以最终固定每个手动插入的部件。

随后,每个电路板都要经过目视检查,然后通过一台使用PH中性清洗剂的电路板清洗机,以确保它们100%清除任何焊锡助焊剂残留物。这曾是该过程中最糟糕的部分之一,需要使用严重有毒的化学物质才能有效清洗电路板,但环境问题开始渗透到此类制造中。

最后,可以安装GPU散热器,最终的显卡从生产线上滚下来…直接进入测试阶段。

从PC合作伙伴的生产线下线的每一张显卡都要经过严格的GPU测试过程,持续整整半个小时。这是我最熟悉的工厂部分,有开放的测试平台可以将卡插入,并有不同的测试软件将部件推到极限。它甚至使用了一些我在办公室使用的相同的测试软件,比如重度曲面细分的Heaven 4.0测试。

无论是在自动光学检测、目视检测还是GPU测试阶段,如果显卡因任何原因出现故障,它将被直接送到故障排查阶段,找出错误所在。从这里,每个失败的显卡将被修复并直接放回生产线。几乎没有浪费,当然也没有令人悲伤的装满报废显卡的箱子杂乱无章地堆放在设施中。

最后,显卡与电缆、适配器和(可能从未使用过的)驱动程序CD一起打包,然后运往更广阔的世界,找到进入你游戏装置的路。

More

这些都是我们每一张显卡所经历的制造过程的直接机制,但在最终生产线投入使用之前,还有很多事情要做。

PC Partner在其东莞工厂还设有电磁兼容性、热测试和声学测试设施,使其能够在承诺在昂贵的生产线上全面生产之前,检查给定产品的操作公差的每一个细微之处。

耗资150万美元的EMC实验室就像直接从《半衰期》测试室中拖出来的东西。他们正在等你,戈登……这是一个密封的房间,可以对设备进行完全隔离的测试,以确保它们完全符合所有电磁规定。

也是在这里,他们测试产品的电气稳定性;故意对电脑及其组件进行电击,以测试它们能承受多大的电击。我担心,当我们的机器人霸主最终接管一切时,这些最终将成为人类对机器持续残忍的展品。

尽管EMC实验室的问题可能比我亲眼目睹的PC Partner工厂内的热刑室要少。有许多不同的机器将技术推向极限,包括在温度计两端都有极端温度的热冲击测试机、长期高温压力测试和环境温度测试,只是为了真正地将它置于死地。

但真正可怕的是五年加速寿命测试。它在85°C的温度和85%的湿度下运行144小时,以模拟显卡的五年使用寿命。这是通过一个复杂的算法计算出来的,并使该公司能够收集给定显卡在未来表现如何的数据。它为其制造的一些公司甚至想要了解10年的使用寿命,但我们不允许看到那台机器,这使我们不必亲眼目睹可怜的硬件在里面必须忍受的心理和生理折磨。

PC Partner还有一个消声室,可以对显卡和迷你PC进行声学测试。它的背景噪声水平极低,只有12-13分贝,这使得该公司能够测量由制造的设备使用的各种风扇和冷却器产生的振动噪声。而且这是一个非常奇怪的地方。

消声室吸收所有反射的声波,急剧地切断噪声。你可能认为额外的安静会很放松,但听觉体验的完全改变是非常令人不安的。

我们很容易忽略在我们仅仅为了娱乐而使用的个人电脑中所拥有的令人难以置信的复杂设备的巨大工作量。而且不仅仅是挑选组件的机器人经历了这一切——你插入你的设备的每一张显卡都是由许多不同的人制造的。

因此,在你甚至还没有将显卡插入灰尘弥漫的个人电脑之前,你卑微的显卡就已经经历了相当多的磨难。下次当你在玩《杀手》或《使命召唤》时,如果它有点不稳定,也许你应该让它休息一下,是吧?

环境 & 显卡

显卡由四个基本部分组成,即所有组件都安装在其上的印刷电路板(PCB)、图形处理单元(GPU)、带有散热片和热管的散热器以及带有风扇的注塑外壳。这些主要部件各自需要单独的环境有害资源收集和精炼方法。显卡的原材料获取和化学组件制造都是对环境有毒的,应该通过化学回收等过程来减轻。不仅获取必要的原材料是不道德的和对环境有害的,而且组装Nvidia RTX 30系列GPU所需的制造和配方过程也是如此。

显卡的基本解剖结构如下。所有显卡基本上都具有相同的一般整体设计:一个高度专门的处理器,在充满芯片和电子元件的电路板上。”(Evanson,Techspot,2020年。)大多数显卡都有某种冷却系统,最常见的是“铜管从铜块上延伸到多排铝散热片”(Evanson,Techspot,2020年。)这些铝散热片将图形处理单元产生的热量引导到显卡的护罩中,在那里,“风扇只是将空气向下引导到散热片中。”(Evanson,Techspot,2020年。)冷却系统下面是印刷电路板或“PCB”,由FR-4非金属基板和树脂绝缘制成。这种基板由玻璃纤维丝和环氧树脂制成,以确保其整体具有强度、轻量和耐热性,同时是非导电的。在这块板上是GPU和其他组件,如RAM(随机存取存储器)所在的位置。GPU由17亿个晶体管组成,“其中一些只做数学运算,比如乘法和加法;其他的读取内存中的值并将其转换为数字信号。”(Evanson,Techspot,2020年。)至于RAM,它必须“直接连接到GPU本身,以确保最佳性能”(Evanson,Techspot,2020年),这被称为迹线。这是所有其他晶体管、芯片和半导体相互通信的相同方式。最后是电源,它使用一个新的专有12针标准,用于从系统中的PSU提供所需的+12v。这些+12v针连接器采用高度耐热的abs塑料制成,以便在超过75°C的图形处理工作温度下不会变形。

在了解了显卡的构造之后,我们可以看看这些组件对环境的影响。“GPU是硅层,上面覆盖有钽和钯晶体管和电容器,以便在更小的芯片上实现更好的存储…由一系列令人难以置信的化学品、铜、硼、钴、钨制成。”(engineering.com,2021年。)这些主要来自东南亚的稀土金属被称为冲突材料,因为它们涉及到不公正的劳动法规和实践,以及它们的高环境影响,例如释放的温室气体比二氧化碳强数千倍。这是由稀土金属采矿行业缺乏监管所导致的。不仅如此,米勒(Penke,2021年)说,“它们的生产过程相当有毒。”不幸的是,“中国并不是唯一环境标准低的国家…例如,蓬勃发展的非法宝石和金属采矿业与雨林枯竭和自然狐猴栖息地的破坏有关。”(Penke,2021年。)这个问题不仅限于监管不力的单一国家,而且似乎是整个行业的做法。制造显卡所需的稀土金属开采对环境的影响非常大,释放的温室气体(GHG)约占排放量的50%。必须采取措施来管理这些影响。

相关实践学习
部署Stable Diffusion玩转AI绘画(GPU云服务器)
本实验通过在ECS上从零开始部署Stable Diffusion来进行AI绘画创作,开启AIGC盲盒。
目录
相关文章
|
Linux
CentOS7(64位)查看CPU和NVIDIA显卡温度
CentOS7(64位)查看CPU和NVIDIA显卡温度
1100 1
CentOS7(64位)查看CPU和NVIDIA显卡温度
|
缓存 运维 Kubernetes
NVIDIA GPU Operator分析一:NVIDIA驱动安装
背景我们知道,如果在Kubernetes中支持GPU设备调度,需要做如下的工作:节点上安装nvidia驱动节点上安装nvidia-docker集群部署gpu device plugin,用于为调度到该节点的pod分配GPU设备。除此之外,如果你需要监控集群GPU资源使用情况,你可能还需要安装DCCM exporter结合Prometheus输出GPU资源监控信息。要安装和管理这么多的组件,对于运维
4106 0
NVIDIA GPU Operator分析一:NVIDIA驱动安装
|
3月前
|
并行计算 API 开发工具
【GPU】GPU 硬件与 CUDA 程序开发工具
【GPU】GPU 硬件与 CUDA 程序开发工具
69 0
|
9月前
显卡(2)
显卡(2)。
38 1
|
机器学习/深度学习 并行计算 PyTorch
Windows系统下有英伟达显卡安装PyTorch
Windows系统下有英伟达显卡安装PyTorch
154 0
|
Linux 异构计算
Linux下查看NVIDIA的GPU使用情况
Linux下查看NVIDIA的GPU使用情况
230 0
|
并行计算 Linux
nvidia-smi报错(重装Nvidia驱动)
nvidia-smi报错(重装Nvidia驱动)
AMD(Radeon R9 M370X这块显卡怎么样)
想必现在有很多小伙伴对于AMD Radeon R9 M370X这块显卡怎么样方面的知识都比较想要了解,那么今天小好小编就为大家收集了一些关于AMD Radeon R9 M370X这块显卡怎么样方面的知识分享给大家,希望大家会喜欢哦。
|
机器学习/深度学习 存储 算法
拿什么拯救我的 4G 显卡
随着深度学习快速发展,同时伴随着模型参数的爆炸式增长,对显卡的显存容量提出了越来越高的要求,如何在单卡小容量显卡上面训练模型是一直以来大家关心的问题。
260 0
拿什么拯救我的 4G 显卡
|
机器学习/深度学习 编解码 并行计算
磨刀霍霍向Gamer 老黄发布英伟达甜点级显卡RTX 2060
RTX 2060的当前游戏速度比上一代GTX 1060(NVIDIA最受欢迎的GPU)快60%,并且击败了GeForce GTX 1070 Ti。
344 0