Nvidia推出强大的新图形芯片Tesl V100加速进军AI和深度学习的步伐

简介:

Nvidia公司携旗下的图形处理器在半导体领域可以说是声名赫赫,Nvidia图形处理器曾为创造最热门的游戏个人电脑立下汗马功劳,而时至今日原来的游戏市场几乎成了后娘的儿子。

Nvidia推出强大的新图形芯片Tesl V100加速进军AI和深度学习的步伐

Nvidia日前在加利福尼亚州圣荷西的GPU技术会议上推出一款强大的新芯片,正如首席执行Jensen Huang黄仁勋(上图)所说的,新芯片的推出标志着下一个计算时代的出现:人工智能的来临,特别是深度学习神经网络的来临,业界最近许多新突破都拜深度学习神经网络所赐,如自驾车和即时语言翻译等。

Tesl V100(下图)的计算能力比Nvidia去年推出的第一个非游戏芯片Pasca芯片的计算能力高五倍。Tesl V100用的是基于新的Volta芯片架构,可在单个大型芯片上包装约2100亿个晶体管,大小与Apple Watch面板相若。黄仁勋暗示Nvidia花了数十亿美元开发Tesl V100,他告诉观众,“如有人想买这东西的话,价钱是30亿美元。”他说完后将一个Tesl V100芯片塞在裤子后口袋里。

Nvidia推出强大的新图形芯片Tesl V100加速进军AI和深度学习的步伐

Tesl V100芯片专门用于深度学习应用,Tesl V100每秒Tensor浮点运算速度比去年的芯片快12倍。Nvidia公司星期二发布的季度业绩报告好过预期, Nvidia今天的股价应声飙升18%,部分原因是从事深度学习的云计算巨头和公司旗下的数据中心芯片翻了三倍。

Nvidia在新芯片里加了一些针对深度学习的功能,包括640个“Tensor Cores”(用于加快AI工作负载的专门电路)。GPU和标准中央处理器之间的互连速度更快了,存储电路的速度更高了,同时还推出了如Nvidia新型TensorRT等软件,TensorRT软件可用于确定哪些数学运算可以更快地以平行运算的形式完成,而不是在标准的CPU上以串行方式完成。 

黄仁勋甚至还提出,诸如英特尔公司制造的传统中央处理器在单个芯片上置入的晶体管数目每两年翻一杯,该趋势是用了数十年的“摩尔定律”,但该趋势已受到限制,而Nvidia的平行处理架构必将在芯片发展中超越传统技术。

他表示,“我们现在要对抗半导体物理学定律。摩尔定律终结后,加速计算将是向前发展的最佳之路。”

新芯片Tesl V100将在第三季度推出新的Nvidia DGX-1超级计算设备,售价为149,000美元。Tesl V100芯片还会在第四季度里提供给其他计算机制造商,并会内置在HGX-1机器里提供给云计算提供商。 Nvidia还宣布会向 个人用户提供DGX工作站,DGX工作站是使用Volta芯片的小型计算机,第三季度上架,售价69,000美元。

Tesl V100技术也可以通过云获得。Nvidia GPU 云软件“堆栈”涵括深入学习软件框架,如TensorFlow、Theano和MXNet。Nvidia GPU 云软件“堆栈”可以在个人计算机Nvidia  DGX-1或云里运行。

黄仁勋还宣布,丰田已经决定采用Nvidia的汽车计算机系统Drive PX。他表示, “Drive PX将成为丰田未来的无人驾驶汽车架构。” Nvidia还与奥迪、特斯拉、梅赛德斯和沃尔沃等其他汽车制造商建立了合作伙伴关系。Drive PX系统含有名为Xavier的芯片,Xavier结合了ARM CPU、Volta GPU和一个深度学习加速器。Drive PX芯片架构将于7月份面向特定用户提供开放源代码, 9月开始面向一般用户提供开放源代码。

另外,Nvidia宣布推出名为Isaac的机器人模拟器,Isaac可在任何Nvidia GPU上运行。黄仁勋表示,经过深度学习预训练的机器人潜力无比。他表示,“这种机器人一经激活几乎就能了解整个世界。”

不过Nvidia也并没有完全放弃旗下的高质量图形老本,Nvidia展出了超现实视频游戏片段。Nvidia还介绍了一个名为Project Holodeck的试验项目,Holodeck具有基于头像的实时协作功能,展示该功能是要表明Holodeck在互动性虚拟现实上具有发展潜力。

Moor 观察和策略所的高级分析师员表示Karl Freund,Nvidia可以将同样的芯片模块技术用在游戏业务上,而游戏业务仍然是Nvidia业务的大头。他表示,“深度学习的使用可以推动降精确度等特定功能的发展,而其架构经过修改后可以用于交付高效率游戏产品。”


原文发布时间为: 2017年5月11日

本文作者:黄雅琦

本文来自云栖社区合作伙伴至顶网,了解相关信息可以关注至顶网。

相关实践学习
在云上部署ChatGLM2-6B大模型(GPU版)
ChatGLM2-6B是由智谱AI及清华KEG实验室于2023年6月发布的中英双语对话开源大模型。通过本实验,可以学习如何配置AIGC开发环境,如何部署ChatGLM2-6B大模型。
相关文章
|
7月前
|
人工智能 Cloud Native Java
书本大纲:从芯片、分布式到云计算AI时代
本文深入探讨并发编程、JVM原理、RPC框架、高并发系统、分布式架构及云原生技术,涵盖内存模型、同步机制、垃圾回收、网络协议、存储优化、弹性伸缩等核心议题,揭示多线程运行逻辑与高并发实现路径,助你掌握现代软件底层原理与工程实践。
233 6
|
10月前
|
机器学习/深度学习 人工智能 供应链
从概念到商业价值:AI、机器学习与深度学习全景指南
在这个科技飞速发展的时代🚀,人工智能正以惊人的速度渗透到我们的生活和工作中👀。但面对铺天盖地的AI术语和概念,很多人感到困惑不已😣。"AI"、"机器学习"、"深度学习"和"神经网络"到底有什么区别?它们如何相互关联?如何利用这些技术提升工作效率和创造价值?
523 0
|
8月前
|
机器学习/深度学习 人工智能 PyTorch
AI 基础知识从 0.2 到 0.3——构建你的第一个深度学习模型
本文以 MNIST 手写数字识别为切入点,介绍了深度学习的基本原理与实现流程,帮助读者建立起对神经网络建模过程的系统性理解。
772 15
AI 基础知识从 0.2 到 0.3——构建你的第一个深度学习模型
|
8月前
|
机器学习/深度学习 人工智能 自然语言处理
AI 基础知识从 0.3 到 0.4——如何选对深度学习模型?
本系列文章从机器学习基础出发,逐步深入至深度学习与Transformer模型,探讨AI关键技术原理及应用。内容涵盖模型架构解析、典型模型对比、预训练与微调策略,并结合Hugging Face平台进行实战演示,适合初学者与开发者系统学习AI核心知识。
612 15
|
12月前
|
机器学习/深度学习 人工智能 自然语言处理
Cosmos-Reason1:物理常识觉醒!NVIDIA 56B模型让AI懂重力+时空法则
Cosmos-Reason1是NVIDIA推出的多模态大语言模型系列,具备物理常识理解和具身推理能力,支持视频输入和长链思考,可应用于机器人、自动驾驶等场景。
585 8
Cosmos-Reason1:物理常识觉醒!NVIDIA 56B模型让AI懂重力+时空法则
|
11月前
|
机器学习/深度学习 人工智能 运维
AI“捕风捉影”:深度学习如何让网络事件检测更智能?
AI“捕风捉影”:深度学习如何让网络事件检测更智能?
432 8
|
12月前
|
人工智能 Kubernetes 安全
积极拥抱AI,F5携手NVIDIA赋能加速AI应用交付
积极拥抱AI,F5携手NVIDIA赋能加速AI应用交付
190 4
|
存储 人工智能 弹性计算
NVIDIA NIM on ACK:优化生成式AI模型的部署与管理
本文结合NVIDIA NIM和阿里云容器服务,提出了基于ACK的完整服务化管理方案,用于优化生成式AI模型的部署和管理。
|
人工智能 并行计算 程序员
【AI系统】SIMD & SIMT 与芯片架构
本文深入解析了SIMD(单指令多数据)与SIMT(单指令多线程)的计算本质及其在AI芯片中的应用,特别是NVIDIA CUDA如何实现这两种计算模式。SIMD通过单指令对多个数据进行操作,提高数据并行处理能力;而SIMT则在GPU上实现了多线程并行,每个线程独立执行相同指令,增强了灵活性和性能。文章详细探讨了两者的硬件结构、编程模型及硬件执行模型的区别与联系,为理解现代AI计算架构提供了理论基础。
2891 12
|
人工智能 数据安全/隐私保护 数据中心
“芯片围城”下国产AI要放缓?答案或截然相反
12月2日,美国对华实施新一轮出口限制,将140余家中国企业列入贸易限制清单。对此,中国多个行业协会呼吁国内企业谨慎选择美国芯片。尽管受限企业表示影响有限,但此事件引发了关于AI领域芯片供应的担忧。华为云推出的昇腾AI云服务,提供全栈自主的算力解决方案,包括大规模算力集群、AI框架等,旨在应对AI算力需求,确保算力供给的稳定性和安全性,助力中国AI产业持续发展。
295 3