Nvidia和AMD显卡是如何制作的

简介: Nvidia和AMD显卡是如何制作的

我们参观了世界上最大的显卡制造商之一,看看魔术是如何发生的。

Perface

对于我这样一个PC硬件发烧友来说,中国无疑是制造业的圣地。所以,当我有机会亲眼见证奇迹时,我立刻收拾行囊,从英国西部那个像夏尔一样的地方出发,穿越6000多英里的距离,来到中国东莞这个被雾霾笼罩的魔多,看看这些技术奇迹是如何诞生的。

就像许多电脑游戏玩家一样,我理所当然地希望我那昂贵、复杂的图形处理器能正常工作,而几乎不去想它是从哪里来的,或是如何到达这里的。但当我有机会亲眼目睹最新一批Nvidia和AMD图形卡在时差还没倒过来的眼前被制造和测试时,我立刻欣然接受了。

是啊,我现在对那些焊接、拧螺丝和测试每一张显卡的工程师们,以及帮助他们完成这项工作的神奇机器有了新的认识。说真的,那些放置组件的小机器人真迷人。我可以整天看着它们…这可能让我更适合在中国的工厂工作,而不是我最初预期的那样。

有许多制造商销售供您游戏乐趣的显卡,但实际组装这些显卡的公司可能比你浏览亚马逊时想象的要少。

我很幸运地参观了一家你可能从未听说过,但很可能使用过其产品的制造工厂。PC Partner自1997年开始作为主板供应商成立以来,一直在推动技术的发展。

第二年,它开始了合同制造业务,并且从未回头。如今,它为众多公司制造产品,如戴尔、AMD、宏碁、三星、蓝宝石、LG、微软,以及自己的品牌:索泰和映众。

在显卡方面,这意味着它同时制造Nvidia和AMD显卡——深入研究就会发现,它们的根源往往来自同一个地方。事实上,PC Partner是AMD显卡最大的合同制造商。虽然我不被允许拍摄正在下线的AMD显卡,所以你只会看到基于Nvidia的索泰显卡。

除了显卡,PC Partner还制造主板、迷你电脑、闪存产品、ATM和销售点设备。数字也非常惊人——仅PC Partner每月就将生产40万张显卡,当你看到这些显卡在到达我们的电脑之前必须经历的每一个过程时,这个数字就显得更加令人印象深刻了。

PC Partner的每一条显卡生产线平均每天可以生产大约4000个单位。但每条生产线并不局限于单一产品——虽然它试图将生产线更换次数限制在每天五次以下,但在高需求时期,生产线的更换次数甚至可能达到这个数字。

这个过程的高度流水线化使得类似显卡之间的切换只需要五分钟,如果从一个小型显卡切换到更大的显卡,最多也只需要15分钟。在制造过程中,从一个完全不同的显卡切换到另一个显卡的周转时间惊人地快。虽然时间就是金钱,但这一切都是值得的。

PC Partner的每一条显卡生产线平均每天可以生产大约4000个单位。但每条生产线并不局限于单一产品——虽然它试图将生产线更换次数限制在每天五次以下,但在高需求时期,生产线的更换次数甚至可能达到这个数字。

这个过程的高度流水线化使得类似显卡之间的切换只需要五分钟,如果从一个小型显卡切换到更大的显卡,最多也只需要15分钟。在制造过程中,从一个完全不同的显卡切换到另一个显卡的周转时间惊人地快。虽然时间就是金钱,但这一切都是值得的。

工厂

东莞工厂的地板是一个严格控制的空间,那里唯一的噪音是制造设备不断的研磨、呼呼声和活塞叹息声。在这座灰色的大建筑的任何一层,每一条不同生产线的许多工作人员都听不到任何人类的噪音。

这是压力环境的产物,在压力环境中,订单必须履行,失败是不可选择的,还是纯粹因为有一群无知的记者在四处游荡——所以尽量忽略他们——我不完全确定。

但生产受到严格控制,制造过程的各个方面都被无数的自动化系统敏锐地观察到,这些系统被输入到一个监控中心。在这里,每一次生产下降,每一个制造错误,都可以被看到,并与前几天、几周或几个月进行比较。

不过,生产并不是工厂里的全部,在生产线准备推出数千张最新的显卡之前,需要进行各种准备测试。但这就是我来的原因,也是我发现自己穿着一件迷人的蓝色防静电外套和一顶相配的帽子站在那里的原因。

制造过程

PC Partner自己不做的一部分过程是创建单独的印刷电路板(PCB)。它有一个设计部门来制定最终布局,但实际制造是外包给其他公司的,裸板是批量到货的,为所有的图形效果做好了准备。

然而,在将任何东西粘在上面之前,每个裸露的PCB都会贴上标签,并设置在一个框架中,该框架可以容纳一对较长的PCB板,也可以容纳四块较小的设计板。它比个人制造更高效,意味着没有显卡单独进入这个世界。

实际过程的第一部分是焊料的丝网印刷。这种粘稠的粘稠物被印在每个裸露PCB的无数接触点上,用于连接后续组件。然后我最喜欢的机器开始工作。

拾取和放置机器是这一过程的精密工件;他们灵活的手指将最微小的组件放置在每块板上,在PCB上以令人眩晕、催眠的高速舞蹈。

这些机器由磁带卷提供,所有单独的部件都连接在磁带卷上。在每条生产线的起点,一组工程师按照特定生产线所需的任何规格组装各个卷筒。

在所有最小的组件都粘在板上后,PCB会经过一个称为回流焊的过程,最终对单元进行烘焙,以确保它们都牢固连接。一旦板冷却,它们就会通过自动光学检查(AOI)机,以100%确保每个微小部件都处于正确的位置。如果它们通过了,PCB就会被翻转过来,这样它们就可以在电路板的另一侧再次经历同样的过程。

这就是真正的GPU被丢弃的神奇时刻发生的时候;当它不再只是一块普通的印刷电路板,上面有几个电阻器和存储芯片,变成一个成熟的图形处理怪物的时候。对我来说,这是这些显卡真正活起来的时候。

但这个过程还没有结束。现在需要安装较大的部件——电容器、电源接头和视频端口——这也是人类真正需要参与的地方。这些部件中的许多都是手工安装的,而不是由拾取和放置机器安装的,然后通过波峰焊机器;在冒泡的熔锡湖中,电路板穿过它们,以最终固定每个手动插入的部件。

随后,每个电路板都要经过目视检查,然后通过一台使用PH中性清洗剂的电路板清洗机,以确保它们100%清除任何焊锡助焊剂残留物。这曾是该过程中最糟糕的部分之一,需要使用严重有毒的化学物质才能有效清洗电路板,但环境问题开始渗透到此类制造中。

最后,可以安装GPU散热器,最终的显卡从生产线上滚下来…直接进入测试阶段。

从PC合作伙伴的生产线下线的每一张显卡都要经过严格的GPU测试过程,持续整整半个小时。这是我最熟悉的工厂部分,有开放的测试平台可以将卡插入,并有不同的测试软件将部件推到极限。它甚至使用了一些我在办公室使用的相同的测试软件,比如重度曲面细分的Heaven 4.0测试。

无论是在自动光学检测、目视检测还是GPU测试阶段,如果显卡因任何原因出现故障,它将被直接送到故障排查阶段,找出错误所在。从这里,每个失败的显卡将被修复并直接放回生产线。几乎没有浪费,当然也没有令人悲伤的装满报废显卡的箱子杂乱无章地堆放在设施中。

最后,显卡与电缆、适配器和(可能从未使用过的)驱动程序CD一起打包,然后运往更广阔的世界,找到进入你游戏装置的路。

More

这些都是我们每一张显卡所经历的制造过程的直接机制,但在最终生产线投入使用之前,还有很多事情要做。

PC Partner在其东莞工厂还设有电磁兼容性、热测试和声学测试设施,使其能够在承诺在昂贵的生产线上全面生产之前,检查给定产品的操作公差的每一个细微之处。

耗资150万美元的EMC实验室就像直接从《半衰期》测试室中拖出来的东西。他们正在等你,戈登……这是一个密封的房间,可以对设备进行完全隔离的测试,以确保它们完全符合所有电磁规定。

也是在这里,他们测试产品的电气稳定性;故意对电脑及其组件进行电击,以测试它们能承受多大的电击。我担心,当我们的机器人霸主最终接管一切时,这些最终将成为人类对机器持续残忍的展品。

尽管EMC实验室的问题可能比我亲眼目睹的PC Partner工厂内的热刑室要少。有许多不同的机器将技术推向极限,包括在温度计两端都有极端温度的热冲击测试机、长期高温压力测试和环境温度测试,只是为了真正地将它置于死地。

但真正可怕的是五年加速寿命测试。它在85°C的温度和85%的湿度下运行144小时,以模拟显卡的五年使用寿命。这是通过一个复杂的算法计算出来的,并使该公司能够收集给定显卡在未来表现如何的数据。它为其制造的一些公司甚至想要了解10年的使用寿命,但我们不允许看到那台机器,这使我们不必亲眼目睹可怜的硬件在里面必须忍受的心理和生理折磨。

PC Partner还有一个消声室,可以对显卡和迷你PC进行声学测试。它的背景噪声水平极低,只有12-13分贝,这使得该公司能够测量由制造的设备使用的各种风扇和冷却器产生的振动噪声。而且这是一个非常奇怪的地方。

消声室吸收所有反射的声波,急剧地切断噪声。你可能认为额外的安静会很放松,但听觉体验的完全改变是非常令人不安的。

我们很容易忽略在我们仅仅为了娱乐而使用的个人电脑中所拥有的令人难以置信的复杂设备的巨大工作量。而且不仅仅是挑选组件的机器人经历了这一切——你插入你的设备的每一张显卡都是由许多不同的人制造的。

因此,在你甚至还没有将显卡插入灰尘弥漫的个人电脑之前,你卑微的显卡就已经经历了相当多的磨难。下次当你在玩《杀手》或《使命召唤》时,如果它有点不稳定,也许你应该让它休息一下,是吧?

环境 & 显卡

显卡由四个基本部分组成,即所有组件都安装在其上的印刷电路板(PCB)、图形处理单元(GPU)、带有散热片和热管的散热器以及带有风扇的注塑外壳。这些主要部件各自需要单独的环境有害资源收集和精炼方法。显卡的原材料获取和化学组件制造都是对环境有毒的,应该通过化学回收等过程来减轻。不仅获取必要的原材料是不道德的和对环境有害的,而且组装Nvidia RTX 30系列GPU所需的制造和配方过程也是如此。

显卡的基本解剖结构如下。所有显卡基本上都具有相同的一般整体设计:一个高度专门的处理器,在充满芯片和电子元件的电路板上。”(Evanson,Techspot,2020年。)大多数显卡都有某种冷却系统,最常见的是“铜管从铜块上延伸到多排铝散热片”(Evanson,Techspot,2020年。)这些铝散热片将图形处理单元产生的热量引导到显卡的护罩中,在那里,“风扇只是将空气向下引导到散热片中。”(Evanson,Techspot,2020年。)冷却系统下面是印刷电路板或“PCB”,由FR-4非金属基板和树脂绝缘制成。这种基板由玻璃纤维丝和环氧树脂制成,以确保其整体具有强度、轻量和耐热性,同时是非导电的。在这块板上是GPU和其他组件,如RAM(随机存取存储器)所在的位置。GPU由17亿个晶体管组成,“其中一些只做数学运算,比如乘法和加法;其他的读取内存中的值并将其转换为数字信号。”(Evanson,Techspot,2020年。)至于RAM,它必须“直接连接到GPU本身,以确保最佳性能”(Evanson,Techspot,2020年),这被称为迹线。这是所有其他晶体管、芯片和半导体相互通信的相同方式。最后是电源,它使用一个新的专有12针标准,用于从系统中的PSU提供所需的+12v。这些+12v针连接器采用高度耐热的abs塑料制成,以便在超过75°C的图形处理工作温度下不会变形。

在了解了显卡的构造之后,我们可以看看这些组件对环境的影响。“GPU是硅层,上面覆盖有钽和钯晶体管和电容器,以便在更小的芯片上实现更好的存储…由一系列令人难以置信的化学品、铜、硼、钴、钨制成。”(engineering.com,2021年。)这些主要来自东南亚的稀土金属被称为冲突材料,因为它们涉及到不公正的劳动法规和实践,以及它们的高环境影响,例如释放的温室气体比二氧化碳强数千倍。这是由稀土金属采矿行业缺乏监管所导致的。不仅如此,米勒(Penke,2021年)说,“它们的生产过程相当有毒。”不幸的是,“中国并不是唯一环境标准低的国家…例如,蓬勃发展的非法宝石和金属采矿业与雨林枯竭和自然狐猴栖息地的破坏有关。”(Penke,2021年。)这个问题不仅限于监管不力的单一国家,而且似乎是整个行业的做法。制造显卡所需的稀土金属开采对环境的影响非常大,释放的温室气体(GHG)约占排放量的50%。必须采取措施来管理这些影响。

相关实践学习
在云上部署ChatGLM2-6B大模型(GPU版)
ChatGLM2-6B是由智谱AI及清华KEG实验室于2023年6月发布的中英双语对话开源大模型。通过本实验,可以学习如何配置AIGC开发环境,如何部署ChatGLM2-6B大模型。
目录
相关文章
|
9月前
|
人工智能 C# C++
在 Visual Studio 上体验腾讯云 AI 代码助手
本文介绍如何在 Visual Studio 2022 中安装和使用腾讯云 AI 代码助手。首先,通过扩展管理器搜索并安装插件,重启 VS 完成安装。接着,在工具栏的“工具”中找到并启动助手,快捷键为 ALT + T。测试时输入问题如冒泡排序,助手会生成 C# 代码并可直接运行。建议优化默认代码语言为 C#、增加代码插入功能,并统一显示位置以提升用户体验。
452 1
|
8月前
|
机器人 数据安全/隐私保护
基于PID控制器的六自由度串联机器人控制系统的simulink建模与仿真
本课题基于MATLAB2022a的Simulink环境,对六自由度串联机器人控制系统进行建模与仿真,采用PID控制器实现关节的位置、速度或力矩控制。PID控制器通过比例、积分、微分三种策略有效减小系统误差,提高响应速度和稳定性。仿真结果显示系统运行良好,无水印。尽管PID控制简单实用,但在复杂动力学环境下,常结合其他控制策略以增强鲁棒性。
|
11月前
|
人工智能 云计算 数据中心
加码香港!连续市场第一,启动新计划
加码香港!连续市场第一,启动新计划
308 4
|
存储 弹性计算 Docker
深入探讨Docker的主要功能及其影响力
【8月更文挑战第24天】
349 0
|
存储 PHP 对象存储
开源免费的图床源码整理汇总-个人自用图床相册程序推荐
开源免费的图床源码整理汇总-个人自用图床相册程序推荐
2313 0
|
Java 关系型数据库 Spring
使用SpringAOP对IN查询进行多线程拆分效率提升巨大
本文介绍了一种通过多线程优化大批量 IN 查询性能的方法,并提供了一个基于 Spring AOP 的注解方案。该方案允许用户通过添加注解来自动拆分查询参数,利用多线程并发执行查询并合并结果,从而显著提高接口响应速度。适用于大批量查询场景,尤其是结果能够简单合并的情况。文中详细描述了如何定义 AOP 注解及其实现逻辑。
193 1
|
存储 人工智能 安全
探秘英伟达显卡的制造之路 | 英伟达断供GPU,中国大模型何去何从?
在当今时代,人工智能技术正以前所未有的速度发展,推动着各个领域的创新与变革。作为人工智能技术的核心引擎之一,高性能GPU扮演着至关重要的角色。在这个领域,英伟达的H100无疑是一款备受瞩目的高端产品。它针对高性能计算和人工智能应用而设计,具备强大的计算能力和高内存容量,以及先进的互连技术,可以有效提升集群中的计算效率,加速深度学习、计算机视觉、自然语言处理等领域的AI训练和推理任务。
1326 0
|
存储 算法 安全
深入理解汇编语言:基础语法和常用指令介绍
深入理解汇编语言:基础语法和常用指令介绍
|
XML JSON 监控
淘宝商品数据接口实战:自动化监控与竞品分析
淘宝开放平台提供的商品列表数据接口是一种API,使开发者能编程获取淘宝商品数据。主要功能包括按关键词、分类等获取商品列表及其详情,并支持分页、排序及多维度筛选。常见参数有关键词、页码、排序方式等。使用需注册账号获取API密钥,构建并发送HTTP请求,解析JSON/XML响应数据进行业务处理。此接口适用于商品监控、市场分析等多种场景。[体验API](http://u6v.cn/5W41Dx)
|
缓存 负载均衡 监控
Nginx性能调优5招35式不可不知的策略实战
以上 V 哥总结的5个方面关于 Nginx性能调优的策略,实际应用中需要结合实际项目的情况来测试,希望对你有帮助,欢迎关注威哥爱编程,技术路上我们一起成长。
411 0