英伟达CEO黄仁勋亲自撰文摆数据怼上谷歌TPU-阿里云开发者社区

英伟达CEO黄仁勋亲自撰文摆数据怼上谷歌TPU

2017-07-05 2142

版权

本文内容由阿里云实名注册用户自发贡献，版权归原作者所有，阿里云开发者社区不拥有其著作权，亦不承担相应法律责任。具体规则请查看《阿里云开发者社区用户服务协议》和《阿里云开发者社区知识产权保护指引》。如果您发现本社区中有涉嫌抄袭的内容，填写侵权投诉表单进行举报，一经查实，本社区将立刻删除涉嫌侵权内容。

简介：

雷锋网按：前不久谷歌发布了关于TPU细节的论文，称“TPU 处理速度比当前 GPU 和 CPU 要快 15 到 30 倍”。当时就有人对此种“比较”表示质疑，因其拿来的比较对象并非市场里性能最好的。

而昨晚（美国时间 4 月 10 日）英伟达 CEO 黄仁勋就亲自撰文回应了这一“比较”，文章第一段就以谷歌 TPU 开头，炮击意图十分明显，随后更是扔出了 Tesla P40 GPU 与 TPU 的性能对比图，可谓针尖对麦芒。

黄仁勋亲自撰文怼上 TPU：P40速度比你快 2 倍，带宽是你的 10 倍

不过 P40 和 TPU 的售价差距很大（P40 24GB版本售价5千多美元，TPU 成本估计在几百美元），尺寸和制程也不一样，也有人觉得这样的对比未免也是不恰当的。但黄仁勋不惜亲自撰写长文，摆事实摆数据，意在表明英伟达在 AI 芯片领域的强势姿态和技术领先的骄傲。

当时TPU论文甫一发布，雷锋网就论文中的比较对象问题咨询了AI人士意见，感兴趣的读者可戳《谷歌公布TPU细节之后，AI业界怎么看？》。以下为黄仁勋发表全文，原文标题为“AI 驱动数据中心加速计算的崛起”（AI Drives the Rise of Accelerated Computing in Data Centers），由雷锋网(公众号：雷锋网)编译。

谷歌最近的TPU论文给出了一个十分明确的结论：如果没有高速计算能力，大规模AI实现根本不可能。

如今的世界经济运行在全球的数据中心之上，而数据中心也在急剧发生改变。不久之前，数据中心服务支撑网页、广告和视频。现在，它们能够从视频流里识别声音、检测图片，还能随时让我们获得想要的信息。

以上提到的各种能力，都在愈来愈依靠深度学习来支撑。深度学习是一种算法，从海量数据里学习形成软件，来处理诸多高难度挑战，包括翻译、癌症诊断、自动驾驶等等。这场由AI引发的变革，正在以一种前所未有的速度影响着各种行业。

深度学习的开拓者Geoffrey Hinton最近在接受《纽约客》采访时说道：“凡是任何一个有很多数据的分类问题，都可以用深度学习的方法来解决。深度学习有几千种应用。”

不可思议的效果

以谷歌为例。谷歌在深度学习里突破性的工作引发了全球关注：Google Now 语音交互系统令人吃惊的精确性、AlphaGo在围棋领域历史性的胜利、谷歌翻译应用于100种语言。

深度学习已经达到了不可思议的效果。但是深度学习的方法，要求计算机在摩尔定律放缓的时代背景下，精确处理海量数据。深度学习是一种全新的计算模型，它也需要一种全新计算架构的诞生。

一段时间以来，这种 AI 计算模型都是运行于英伟达芯片之上。2010 年，研究员 Dan Ciresan 当时在瑞士 Juergen Schmidhuber 教授的 AI 实验室工作，他发现英伟达 GPU 芯片可以被用来训练深度神经网络，比 CPU 的速度快 50 倍。一年之后，Schmidhuber 教授的实验室又使用 GPU 开发了世界上首个纯深度神经网络，一举赢得国际手写识别和计算机视觉比赛的冠军。接着，在 2012 年，多伦多大学的硕士生 Alex Krizhevsky 使用了两个 GPU，赢得了如今蜚声国际的 ImageNet 图像识别竞赛。（Schmidhuber教授曾经写过一篇文章，全面梳理了运行于GPU之上的深度学习对于当代计算机视觉的影响 http://people.idsia.ch/~juergen/computer-vision-contests-won-by-gpu-cnns.html）

深度学习优化

全球的 AI 研究员都发现了，英伟达为计算机图形和超级计算应用所设计的 GPU 加速计算模型，是深度学习的理想之选。深度学习应用，比如 3D 图形，医疗成像、分子动力学、量子化学和气象模拟等，都是一种线性代数算法，需要进行大规模并行张量或多维向量计算。诞生于 2009 年的英伟达 Kepler GPU 架构，虽然帮助唤醒了世界在深度学习中使用 GPU 加速计算，但其诞生之初并非为深度学习量身定制的。

所以，我们必须开发出新一代GPU架构，首先是 Maxwell，接着是 Pascal，这两种架构都对深度学习进行了特定的优化。在Kepler Tesla K80 之后四年，基于 Pascal 架构的 Tesla P40 推理加速器诞生了，它的推理性能是前者的 26 倍，远远超过了摩尔定律的预期。

在这一时期，谷歌也设计了一款定制化的加速器芯片，名为“张量处理单元”，即 TPU。具体针对数据推理，于 2015 年部署。

上周，谷歌团队发布了关于 TPU 优越性的一些信息，称 TPU 比 K80 的推理性能高出 13 倍。但是，谷歌并没有拿 TPU 与如今最新一代的 Pascal P40 做比较。

英伟达CEO黄仁勋亲自撰文摆数据怼上谷歌TPU

热门文章

最新文章

相关电子书

探索云世界

热门

云计算

大数据

云原生

人工智能

数据库

开发与运维

活动广场

任务中心

训练营

直播

乘风者计划

下载

镜像站

技术资料

英伟达CEO黄仁勋亲自撰文摆数据怼上谷歌TPU

热门文章

最新文章

相关电子书