深度学习装机指南:我们为普通青年和土豪准备了两套方案

简介:
本文来自AI新媒体量子位(QbitAI)

深度学习,始于装机。


研究深度学习该买一台什么样的电脑?我的笔记本能满足需求吗?

量子位请来小伙伴,为当前的深度学习网络训练提供了两套最新的装机方案。

第一套方案是预算为8000元的深度学习标准型台式机,这款台式机能够运行市面上几乎所有的大型游戏,完美全特效不掉帧,同时还可以顺便玩一下深度学习应用,例如奇特的风格融合。这套配置可以满足目前深度学习大部分的训练需求。

第二套方案是预算为20000左右的土豪版台式机,这款台式机为工作站主板,极其稳定,能够长时间开机稳定训练。

话不多说,直接上配置。

第一套·标准型

配件名 品牌型号 数量 价格
机箱 美商海盗船 400C 中塔侧透机箱 1 749 京东
主板 华硕 Z170I PRO GAMING Mini-ITX主板 1 1299 天猫
CPU 英特尔 I7 7700K 酷睿第7代处理器 1 1799 - 2799
内存 美商海盗船 复仇者8G DDR4 2400 2 798 京东
SSD 三星850 EVO 250G M.2 固态硬盘 1 699 京东
机械硬盘 西部数据 蓝盘 2TB 64M 台式机硬盘 1 499 京东
GPU 七彩虹GTX1060 6G超频版游戏显卡 1 1799 天猫
电源 美商海盗船VS650 额定650w电源 1 399 京东
CPU风冷器 乔思伯 HP625日食红 CPU散热器 1 159 京东
显示屏 AOC I2279VW 21.5英寸显示器 1 699 天猫

总计:8200 - 9200元(不包括显示器)

第二套·土豪版

配件名 品牌型号 数量 价格
机箱 美商海盗船 600C 中塔侧透机箱 1 999 京东
主板 华硕 /Asus X99-M WS/USB 3.1主板 1 2599 天猫
CPU 英特尔 I7 6800K 酷睿第7代处理器 1 3399 天猫
内存 美商海盗船 复仇者16G DDR4 3000 2 1878 京东
SSD 三星960 EVO 500G M.2 NVMe SSD 1 1799 京东
机械硬盘 西部数据黑盘 2TB 64M台式机硬盘 1 999 京东
GPU NVIDIA TITAN X 12G Pascal(可替1080TI) 1 9699 京东
电源 美商海盗船 额定750W金牌电源 1 969 京东
CPU散热器 美商海盗船H80i V2 CPU水冷散热器 1 759 京东
显示屏 AOC I2279VW 21.5英寸显示器 1 699 天猫

总计:23100元(不包括显示器)

下面我们对这些配件分别进行分析:

1. 机箱

机箱的选取需要考虑两个问题:

1. 主板、CPU散热器是否能够装得下;

2. 整体散热性和稳定性是否满足需求。

先说标准版配置,在进行入门研究只用一块显卡的情况下,散热不存在问题,推荐海盗船400C的中塔机箱,小巧稳定。

对于土豪版配置,由于采用了华硕的M款工作站主板,后期具有增加到两块显卡的可能性,适当地增大机箱的空间,建议选海盗船600C中塔机箱。

如果有上四路TITAN X的打算,那么需要选取散热条件更好、空间更大的机箱,可以用跟Nvidia DevBox同款的机箱,即Corsair Carbide Air 540,也可以是追风者PK515E或515ETG中塔机箱,个人觉得后者的颜值高一些,这两款都可以用来组装具有四路TITAN X的深度学习工作站。

2. 主板

主板的基本要求是稳定性足够好,具有较多的PCI-E Gen3 x16接口。

由于标准版配置只计划选用一块显卡,故选取了游戏级别的华硕 Z170I主板,该款主板只具有一个PCI-E Gen3 x16接口。

当按工作站要求来选择主板时,有两个指标:最好是X99平台和拥有较多的PCI-E Gen3 x16接口。华硕推出了两款工作站主板,分别是具有两路PCI-e 3.0 x16接口的Asus X99-M WS/USB 3.1工作站小板和具有四路PCI-e 3.0 x16接口的Asus X99-E WS/USB 3.1工作站大板。

所以,我们在第二套土豪版配置中采用了Asus X99-M WS/USB 3.1工作站小板,可以扩展到两路TITAN X或者是GTX 1080 TI。

具有四路TITAN X的Nvidia DevBox工作站用的是Asus X99-E WS主板,当有计划上四路TITAN X打算的话,主板可以选用Asus X99-E WS/USB 3.1工作站大板,避免由于后期扩展显卡但是主板存在局限性的问题。

3. CPU

选择CPU,主要是观察三个指标:主频,核心数和总线带宽。

在第一套标准配置中,由于是单机单卡,所以选择目前主频最高的I7-7700K。i7-7700k的散片价格为1799,质保一年;盒装价格为2799,质保三年。据销售称,这两者没有实质性的差异,可根据自身需求进行选择。

在单机多卡进行训练时,总线带宽是瓶颈,所以CPU的PCI-e lane越多越好,一般消费级的CPU,PCI-e总线根数是16, 28或40,最大就是40,进一步提升带宽就需要上服务器CPU或者双路至强CPU了。

有40带宽的这个条件下,有5款CPU入围,分别是:

  • i7-5930K(2014.3 3.5G 15mb 6核)
  • i7-5960X(2014.3 3.0G 20mb 8核)
  • i7-6850K(2016.2 3.6G 15mb 6核)
  • i7-6900K(2016.2 3.2G 20mb 8核)
  • i7-6950X(2016.2 3.0G 25mb10核)

还有一款为28带宽的CPU i7-6800K(2016.2 3.4G 15mb 6核)。

Nvidia官方推出的DevBox工作站所使用的CPU是i7-5930K,由于版本的更新,所以经过参数比较,第二套土豪级配置最多使用两块显卡,上手i7-6800K是比较合适的。

如果有上四块显卡的可能,建议使用上述所提到的5款总线带宽为40的CPU。

4. 内存

消费级的i7 CPU最大支持内存是128G。深度学习工作站内存选取技巧:内存大约为显存的两倍。

因此,我们在第一套标准版配置中使用了16G DDR4 3000的内存,在第二套土豪级配置中使用了32G的内存。内存的可扩展性很强,可以在使用中根据实际的占用情况来进行增减。

5. SSD

系统盘需要使用一块SSD,能够进行高速数据读取和存储。当前SATA III接口的SSD最普遍也最便宜,不过由于上述的两个主板都具有一个M.2接口,可以买一个M.2 NVMe的SSD,速度比SATA III接口也有所提升。

利用主板的这个接口,可以根据容量的需求来选择容量为256G或者是500G的SSD,例如三星960 EVO 500G M.2 NVMe SSD。

6. 机械硬盘

机械硬盘分为日常蓝盘(家用存储)、NAS红盘(网络数据存储)、企业金盘(密集读取型)、监控紫盘(存储密集型)、游戏黑盘(高端存储型)。

硬盘数据存储要求稳定,不存在数据丢失。

蓝盘为日常家用,最为通用;黑盘极其稳定,但是在运行过程中声音较大;红盘多用服务器数据存储,声音较小。故在第一套标准版配置中选择家用蓝盘即可,在第二套土豪级配置中最为高端稳定的黑盘作为存储盘,同时金盘也是不错的选择。

7. GPU

Tesla GPU性能很强劲,双精度计算能力非常优秀,适用于研究深度学习的超级计算机,但是Tesla K卡(K40,K80)十分昂贵,K40的价格为27000,K80的价格为37000。据一部分科研工作者反馈,对于网络计算的精度不需要达到这么高。

国内的公司和科研机构一般是使用一块Titan X Pascal,或者是两块GTX 1080,随着新品的面世,GTX1080 TI也是一个不错的选择。

GPU是计算的关键要素,利用台式机GPU来研究深度学习,就是通过足够的CUDA单元,以及配套的显存资源,来进行深度计算。尽管GPU也存在频率和显存带宽的差异,但是对于大部分的网络训练,6G及以上都是满足要求的。下图是对常用显卡的一个比较,可见如果是大量扩展时,1080TI和1070是比较合适的。

在标准版配置中,只能上一块GPU,建议显存大于等于6G,版本高于等于GTX 1060,即可满足日常实验研究,训练VGG网络或者Alexnet网络都不是问题。

上升到X99工作站主板后,最多可插两块Titan X或者四块 GTX 1080TI(当然仍然可以使用GTX 1080),上面选择的PCI-e总线为40的规定用于此处。

GTX1080 8G显存的价格是4100元左右;GTX 1080 TI显卡的价格是5700元左右,性能可以和Titan X相媲美,目前性价比最高;Titan X 12G显卡的价格是9700元,比较适用单次任务显存占用量高的网络,运行速度大约是GTX1080的1.6倍。

因此,我们在第二套土豪版配置中上了一块TITAN X,当然你也可以换成GTX 1080 TI,这也是不错的选择,根据实际训练情况再进行添置GPU。

特别需要注意的是,千万别买同级别的AMD卡!

NVida对深度学习计算的支持远远好于AMD,不然你会沉浸于无穷无尽的加速库安装和环境配置之中。

8. 电源

电源最高功率的计算可以通过鲁大师的功率计算功能得出,将得到的功率乘以1.4倍就是所需要购买的实际电源瓦数。

在第一种标准版配置中,实际功率大约为150+150+100=400w,保留充足的余量,选择海盗船VS650w的电源。

在第二种土豪版配置中,实际功率大约为250+150+100=500w,选择USCorsair RM750x金牌电源。如果你的台式机可能后期会添加显卡,那么你可能要考虑到这个问题,最多加装两个TITAN X的话,1000w电源已经足够了。

9. CPU散热器

考虑到台式机运行过程中CPU散热量较大,可以进行加装CPU风冷,如第一套配置里所用的,也可以进行加装CPU水冷,在第二套土豪级配置中用到了海盗船的水冷散热器。

以上是对深度学习装备的分析,以及面对8000和20000元分别推荐的配置清单。

其实,作者自己曾经花费4万元组装了一台深度学习工作站,更土豪的朋友可以点击阅读原文查看知乎上所提到的具体配置,或者进群一起讨论性能更高的配置方案。

本文作者:王新民 
原文发布时间:2017-03-28
相关实践学习
部署Stable Diffusion玩转AI绘画(GPU云服务器)
本实验通过在ECS上从零开始部署Stable Diffusion来进行AI绘画创作,开启AIGC盲盒。
相关文章
|
2月前
|
机器学习/深度学习 传感器 人工智能
穹彻智能-上交大最新Nature子刊速递:解析深度学习驱动的视触觉动态重建方案
上海交大研究团队在Nature子刊发表论文,提出基于深度学习的视触觉动态重建方案,结合高密度可拉伸触觉手套与视觉-触觉联合学习框架,实现手部与物体间力量型交互的实时捕捉和重建。该方案包含1152个触觉感知单元,通过应变干扰抑制方法提高测量准确性,平均重建误差仅1.8厘米。实验结果显示,其在物体重建的准确性和鲁棒性方面优于现有方法,为虚拟现实、远程医疗等领域带来新突破。
93 32
|
8月前
|
机器学习/深度学习 自然语言处理 机器人
基于深度学习的智能语音机器人交互系统设计方案
**摘要** 本项目旨在设计和实现一套基于深度学习的智能语音机器人交互系统,该系统能够准确识别和理解用户的语音指令,提供快速响应,并注重安全性和用户友好性。系统采用分层架构,包括用户层、应用层、服务层和数据层,涉及语音识别、自然语言处理和语音合成等关键技术。深度学习模型,如RNN和LSTM,用于提升识别准确率,微服务架构和云计算技术确保系统的高效性和可扩展性。系统流程涵盖用户注册、语音数据采集、识别、处理和反馈。预期效果是高识别准确率、高效处理和良好的用户体验。未来计划包括系统性能优化和更多应用场景的探索,目标是打造一个适用于智能家居、医疗健康、教育培训等多个领域的智能语音交互解决方案。
|
7月前
|
机器学习/深度学习 数据采集 存储
【2021 第五届“达观杯” 基于大规模预训练模型的风险事件标签识别】2 DPCNN、HAN、RCNN等传统深度学习方案
参加2021第五届“达观杯”基于大规模预训练模型的风险事件标签识别比赛的经验,包括使用DPCNN、HAN、TextRCNN、CapsuleNet和TextRCNNAttention等传统深度学习模型的方案实现,以及提分技巧,如多个模型的提交文件投票融合和生成伪标签的方法。
55 0
|
10月前
|
机器学习/深度学习 传感器 自动驾驶
【专栏】深度学习将继续推动自动驾驶技术的进步,提供更安全、便捷的出行方案
【4月更文挑战第27天】本文探讨了深度学习在自动驾驶图像识别中的应用,该技术通过模拟人脑认知处理大量标注数据,实现对图像的准确识别。深度学习模型在特征提取和泛化能力上优于传统方法,能用于识别交通标志、车辆、行人等,进行障碍物检测与避障,以及行为预测和决策制定。尽管面临数据获取、计算资源和泛化能力的挑战,但随着技术发展,深度学习将继续推动自动驾驶技术的进步,提供更安全、便捷的出行方案。
144 5
|
机器学习/深度学习 人工智能 自然语言处理
人工智能知识图谱之信息抽取:基于Labelstudio的UIE半监督深度学习的智能标注方案(云端版),提效。
人工智能知识图谱之信息抽取:基于Labelstudio的UIE半监督深度学习的智能标注方案(云端版),提效。
|
传感器 计算机视觉 机器学习/深度学习
ECCV18 | 谷歌普林斯顿提出首个端到端立体双目系统深度学习方案
本文是计算机视觉顶会ECCV 2018录取论文中备受关注的一篇,来自谷歌&普林斯顿大学的研究人员提出了第一个主动双目立体成像系统的深度学习解决方案,在诸多具有挑战性的场景中展示出最先进的结果。
4590 0

热门文章

最新文章