5月10号的一场发布会,让英伟达的股票疯涨了18个点。在公布和丰田合作方案、GPU云平台、机器人AI虚拟训练系统Isaac等等表因背后,更深层的还应该是英伟达新一代Volta架构在硬件上取得的突破。
Volta架构拥有全新的张量运算指令Tensor Core,能够将深度学习神经网络的训练速度提高12倍,同时也将提高深度学习的推理速度。
可能很多人对于这条新闻的理解就停留于股票疯涨,下面就分别来谈谈深度学习神经网络、深度学习训练和深度学习推理这三个看似复杂,实则简单的名词。
深度学习神经网络
神经网络四个字之所以让人觉得高深,或许是因为它听起来很像是用机器模仿生物。实际上,神经网络并非是在物理上用某种材料模仿人的神经,而是从抽象层面去模仿人的思维方式。
人类的思维方式有两种,一种是逻辑思维——简单来说是通过一步步的推论得出对事物的结论。另一种则是形象思维——对事物的客观形象进行感知并储存,通过事物的特征去把握规律,最终通过联想、想象的方式进行表达。
从生物学上来讲,人体的大量神经元、细胞、触点等等连接构成神经网络,对信息进行感知、分析和判断。注意,当我们用这种思维方式处理信息时,主要依靠的是神经元之间的互相作用。
而我们所提到深度学习神经网络,就是在模仿人体神经元之间的互相作用。
深度学习训练
当我们在购买了一个自认为美味的苹果时,或许取决于它的饱满程度、它的颜色和气味。我们所认识到苹果的种种特征与苹果是否美味之间的关系,就是神经元之间的相互作用的结果。
当我们用机器模仿人脑运作时,我们希望看到的是机器拥有输入(苹果的特征)和输出(苹果是否好吃)两个元素时,自己就能够总结出规则(什么样子的苹果好吃或难吃)。
本质上来说,这是一个学习的过程,所以神经网络和深度学习常常相伴出现。
如果我们希望机器能够分辨苹果的味道,我们应该做什么?显然是让它像品鉴师一样,“品尝”大量不同的苹果。这一过程,就是深度学习神经网络的“训练”。
我们“输入”给机器一个苹果,询问它这个苹果是否好吃,机器看到的不仅仅是一个苹果,而是苹果的颜色、大小甚至于表皮上有多少斑点这一类人脑无法识别的特征。当它错误的输出好吃或不好吃的结论时,它会根据苹果的种种特征向上回溯,思考自己究竟是在颜色、大小还是哪一种特征中出了错误。当我们给它足够多的苹果时,它就会领悟到好吃的苹果应该是什么样。
深度学习神经网络的训练就像是在走迷宫,“输入”的苹果是迷宫的入口,而其中苹果的千百种颜色、千百种形状是迷宫中复杂的岔路,而出口只有一个,那就是好吃。机器发现在青色苹果这一条岔路中碰了壁,就会回到岔路口,尝试红色、黄色等等路口能不能走出去。当机器走遍所有岔路,走出迷宫时,它自然学会了那种苹果是好吃的。
深度学习推理
在训练过程中,深度学习神经网络已经做的很伟大了——它没有味蕾却能判断苹果的味道。目前不断发展的硬件技术,也可以让这一计算过程所需时间逐步减少。
可问题在于,即使深度学习神经网络“可以”找到迷宫正确的出口,可他每一次寻找同一个迷宫出口的方式都是将整个迷宫行走一遍。那所谓“训练”二字的意义就不复存在。
这也是为什么,神经网络需要推理。
当机器领悟到:红色、有香气的苹果=好吃,给它一个绿色的苹果,它将不再去“闻”绿苹果是否有香气,而是直接给出不好吃这个答案。说白了,训练是机器在迷宫中找到正确路线,而推理则是把迷宫中所有错误的岔路都堵住。
这时我们再回头看英伟达Tensor Core提到的训练速度提高和推理速度提高就能明白,Tensor Core让机器提高了“找到”迷宫出口的速度——这一部分主要应用的是并行计算,让机器拥有“分身”,可以同时出现在数个岔路口判断此路通否,也让机器提高了在迷宫正确路线上行走的速度——也是对GPU性能最大的考验。
在英伟达专注的自动驾驶领域,深度学习神经网络是被应用极多的技术之一,驾驶系统要不断的被输入行驶时的多种情况——从天气到路况再到周边车辆,再输出自身的反应——是否加速、是否停车等等。
相比判断苹果的美味与否,我们可以这样形容双方计算量的差异,判断苹果的美味与否是让机器在二维平面中走出迷宫,而深度学习神经网络于自动驾驶的应用,恐怕是让机器走出一个五维立体的举行迷宫,其中也许还分布着几个虫洞。
对于英伟达这样的硬件厂商而言,能做到的就是不断增强硬件的计算能力,提高机器在迷宫中的移动速度。帮助我们更快的找到新世界的出路,大概这也是一切技术的价值所在吧。
本文转自d1net(转载)