从怎样分辨苹果甜不甜说起,聊一聊英伟达的“怪兽芯片”

简介:

5月10号的一场发布会,让英伟达的股票疯涨了18个点。在公布和丰田合作方案、GPU云平台、机器人AI虚拟训练系统Isaac等等表因背后,更深层的还应该是英伟达新一代Volta架构在硬件上取得的突破。

Volta架构拥有全新的张量运算指令Tensor Core,能够将深度学习神经网络的训练速度提高12倍,同时也将提高深度学习的推理速度。

可能很多人对于这条新闻的理解就停留于股票疯涨,下面就分别来谈谈深度学习神经网络、深度学习训练和深度学习推理这三个看似复杂,实则简单的名词。

深度学习神经网络

神经网络四个字之所以让人觉得高深,或许是因为它听起来很像是用机器模仿生物。实际上,神经网络并非是在物理上用某种材料模仿人的神经,而是从抽象层面去模仿人的思维方式。

人类的思维方式有两种,一种是逻辑思维——简单来说是通过一步步的推论得出对事物的结论。另一种则是形象思维——对事物的客观形象进行感知并储存,通过事物的特征去把握规律,最终通过联想、想象的方式进行表达。

从生物学上来讲,人体的大量神经元、细胞、触点等等连接构成神经网络,对信息进行感知、分析和判断。注意,当我们用这种思维方式处理信息时,主要依靠的是神经元之间的互相作用。

而我们所提到深度学习神经网络,就是在模仿人体神经元之间的互相作用。

深度学习训练

当我们在购买了一个自认为美味的苹果时,或许取决于它的饱满程度、它的颜色和气味。我们所认识到苹果的种种特征与苹果是否美味之间的关系,就是神经元之间的相互作用的结果。

当我们用机器模仿人脑运作时,我们希望看到的是机器拥有输入(苹果的特征)和输出(苹果是否好吃)两个元素时,自己就能够总结出规则(什么样子的苹果好吃或难吃)。

本质上来说,这是一个学习的过程,所以神经网络和深度学习常常相伴出现。

如果我们希望机器能够分辨苹果的味道,我们应该做什么?显然是让它像品鉴师一样,“品尝”大量不同的苹果。这一过程,就是深度学习神经网络的“训练”。

我们“输入”给机器一个苹果,询问它这个苹果是否好吃,机器看到的不仅仅是一个苹果,而是苹果的颜色、大小甚至于表皮上有多少斑点这一类人脑无法识别的特征。当它错误的输出好吃或不好吃的结论时,它会根据苹果的种种特征向上回溯,思考自己究竟是在颜色、大小还是哪一种特征中出了错误。当我们给它足够多的苹果时,它就会领悟到好吃的苹果应该是什么样。

深度学习神经网络的训练就像是在走迷宫,“输入”的苹果是迷宫的入口,而其中苹果的千百种颜色、千百种形状是迷宫中复杂的岔路,而出口只有一个,那就是好吃。机器发现在青色苹果这一条岔路中碰了壁,就会回到岔路口,尝试红色、黄色等等路口能不能走出去。当机器走遍所有岔路,走出迷宫时,它自然学会了那种苹果是好吃的。

深度学习推理

在训练过程中,深度学习神经网络已经做的很伟大了——它没有味蕾却能判断苹果的味道。目前不断发展的硬件技术,也可以让这一计算过程所需时间逐步减少。

可问题在于,即使深度学习神经网络“可以”找到迷宫正确的出口,可他每一次寻找同一个迷宫出口的方式都是将整个迷宫行走一遍。那所谓“训练”二字的意义就不复存在。

这也是为什么,神经网络需要推理。

当机器领悟到:红色、有香气的苹果=好吃,给它一个绿色的苹果,它将不再去“闻”绿苹果是否有香气,而是直接给出不好吃这个答案。说白了,训练是机器在迷宫中找到正确路线,而推理则是把迷宫中所有错误的岔路都堵住。

这时我们再回头看英伟达Tensor Core提到的训练速度提高和推理速度提高就能明白,Tensor Core让机器提高了“找到”迷宫出口的速度——这一部分主要应用的是并行计算,让机器拥有“分身”,可以同时出现在数个岔路口判断此路通否,也让机器提高了在迷宫正确路线上行走的速度——也是对GPU性能最大的考验。

在英伟达专注的自动驾驶领域,深度学习神经网络是被应用极多的技术之一,驾驶系统要不断的被输入行驶时的多种情况——从天气到路况再到周边车辆,再输出自身的反应——是否加速、是否停车等等。

相比判断苹果的美味与否,我们可以这样形容双方计算量的差异,判断苹果的美味与否是让机器在二维平面中走出迷宫,而深度学习神经网络于自动驾驶的应用,恐怕是让机器走出一个五维立体的举行迷宫,其中也许还分布着几个虫洞。

对于英伟达这样的硬件厂商而言,能做到的就是不断增强硬件的计算能力,提高机器在迷宫中的移动速度。帮助我们更快的找到新世界的出路,大概这也是一切技术的价值所在吧。

本文转自d1net(转载)

相关文章
|
人工智能 文字识别 监控
将人工智能融入多媒体 助力视频产业加速——阿里云视频AI全能力解读
结合人工智能视频理解流程和用户的需求场景,我们将视频AI的功能分成四个大部分,视频智能审核、视频内容理解、视频智能编辑、视频版权保护。其中视频审核功能包括视频鉴黄、暴恐涉政识别、广告二维码识别、无意义直播识别等,利用识别能力将网络上没营养和不健康的视频内容进行排查和处理;视频理解功能包括视频分类、标签,人物识别、语音识别,同时也包括对视频中的文字进行识别(OCR);视频编辑层面可以实现视频首图、视频摘要、视频highlight的生成,同时支持新闻拆条;关于视频版权,支持视频相似性、同源视频检索和音视频指纹等功能。
17667 0
将人工智能融入多媒体 助力视频产业加速——阿里云视频AI全能力解读
|
1月前
|
人工智能 自然语言处理 Java
从 Java 到 AI:三周求职冲刺打卡,步步为营拿 offer
本计划帮助具备Java、.NET、Vue背景的开发者三周内转型为AI应用工程师,专注实战,聚焦模型调用、RAG、Prompt工程等技能,完成多个AI应用项目,打造可用于求职的简历与作品集。
242 9
|
2月前
|
人工智能 自然语言处理 安全
2025年,如何成为不被AI淘汰的技术人?
大模型思维成为高薪人才的核心竞争力
109 2
|
3月前
|
XML 存储 Java
Python-docx编号列表解析:从XML迷宫到结构化数据的破局之道
本文深入解析了Word文档中自动编号的存储机制及解析难题,探讨了其在技术处理中的障碍,并通过三种实战方案对比,帮助开发者高效提取结构化数据。内容涵盖底层XML结构、常见问题解决方案及性能优化技巧,适用于合同条款、文档自动化处理等场景。
179 0
|
9月前
|
运维 安全 Linux
龙蜥衍生版KerarchOS迁移方案及实践分享|龙蜥大讲堂106期
本次分享来自龙蜥大讲堂106期,主题为“龙蜥衍生版KerarchOS迁移方案及实践”。内容涵盖服务器操作系统现状、安全高性能操作系统KeyarchOS的介绍、CentOS停服后的应对策略(重装或迁移),以及CentOS停更带来的危机与迁移背景。重点介绍了两种迁移方案:原地迁移和扩展迁移,并详细讲解了KeyarchOS迁移工具X2Keyarch的操作流程。通过实际案例展示了操作系统迁移的具体步骤和效果,帮助用户更好地理解和实施迁移工作。
123 7
|
8月前
|
存储 机器学习/深度学习 PyTorch
PyTorch Profiler 性能优化示例:定位 TorchMetrics 收集瓶颈,提高 GPU 利用率
本文探讨了机器学习项目中指标收集对训练性能的影响,特别是如何通过简单实现引入不必要的CPU-GPU同步事件,导致训练时间增加约10%。使用TorchMetrics库和PyTorch Profiler工具,文章详细分析了性能瓶颈的根源,并提出了多项优化措施
330 1
PyTorch Profiler 性能优化示例:定位 TorchMetrics 收集瓶颈,提高 GPU 利用率
|
10月前
|
人工智能 运维 Devops
CAP:Serverless + AI 让应用开发更简单
对于众多开发者而言,Serverless 架构的核心优势在于其能够无缝集成多种云产品与组件,从而使得开发者可以更加专注于核心业务逻辑和创新。此外,Serverless 架构还提供了按量付费的灵活计费模式,进一步降低了资源成本。使用云应用开发平台 CAP,在 AI 领域,企业就可以专注于模型训练、算法优化等关键任务,让 AI 应用的开发、部署以及全生命周期的管理更加简单。可以预见 Serverless 技术将催生一系列创新且有趣的应用,而这些应用将不断拓展 AI 技术的边界。
|
10月前
|
数据采集 机器学习/深度学习 人工智能
AI在医疗诊断中的应用与挑战
随着人工智能(AI)技术的飞速发展,其在医疗领域的应用也日益广泛。从辅助医生进行疾病诊断到提供个性化治疗方案,AI技术正在改变着传统医疗模式。然而,AI在医疗诊断中的应用并非一帆风顺,面临着数据质量、模型可解释性、法规政策等一系列挑战。本文将从AI在医疗诊断中的具体应用场景出发,探讨其面临的主要挑战及未来发展趋势。
296 13