英伟达的CEO黄仁勋曾经说,他最喜欢三件事——游戏、GPU、深度学习。这三件事也是英伟达的命脉所在。5年前黄仁勋英明的判断将GPU从游戏转向深度学习成就了他自己和他的公司在深度学习界的地位。
不过,当一个市场被一家企业所主导,这家企业就可能采取各种措施,获取尽可能多的利润,甚至达到垄断的目的。
最近,日本公司Ubiquitous Entertainment总裁兼首席执行官清水亮撰文[1],指责英伟达悄然修改终端用户使用协议,禁止在数据中心使用GeForce软件,并称这一改动将会影响广大的深度学习研究者和开发人员。
一石激起千层浪,“英伟达全新EULA禁止在数据中心使用GeForce系列GPU做深度学习”,已经成为今日Reddit等网站头条。
货还是给你买,但在数据中心不能用于深度学习
英伟达更新后的EULA,并不是不允许在数据中心使用GeForce显卡,而是禁止在数据中心部署GeForce配套软件(不授权)。
修改后的英伟达GeForce软件用户使用协议,No Datacenter Deployment,软件不能在数据中心使用。
软件不能用意味着什么?
货还是给你买,但是不准用作深度学习(但是用来挖矿可以,这个后面会细说)。
大家都知道,英伟达货卖得好,主要原因是配套的软件做得齐。正如清水亮在文章中指出的那样,在实践中,英伟达可以说是全世界唯一提供API和足够多运算函数来做深度学习的半导体公司。
英特尔和其他公司也在奋力追赶,但相比与英伟达的丰富资源和IP,目前这些公司仍然只能恨居追赶的位置。
GeForce vs Tesla:性能相差不大,但价格却天上地下
那么,GeForce和Tesla的区别又在哪里?
英伟达最初开发GPU是用于游戏的,产品线包括针对游戏的GeForce系列和用于高端处理器的Tesla系列。一组简单的数字:
GeForce GTX 1080: PASCAL; 2560 CUDA cores; 8 TFLOPS (single-prec); 8 GB GDDRX5 320 GB/s; max 180 W.Tesla P100: PASCAL; 3584 CUDA cores; 9.3 TFLOPS (single-prec); 16 GB HBM2 732 GB/s; max 250 W.
这样看不直观。有人专门做了对比[2],下图展示了训练的平均时间。Tesla在基准测试中胜过了GeForce;但是,只有1.25倍的加速(或者说,训练时间减少了20%)。在MNIST基准上看,差异并不明显,可能是由于epoch速度太快。
在DeepConvLSTM这个基准上,两者运行时的能耗和温度分别是:
很显然,Tesla的处理性能和稳定性更高一些,但这两个系列都基于Pascal架构,硬件规格(specifications)也非常类似。
然而,在价格方面,Tesla却将近是GeForce的10倍。
因此,那些对GPU使用,尤其是不需要持续运转,在稳定性方面要求没有那么高的用户,往往使用GeForce来代替Tesla,包括一些数据中心客户在内——毕竟,不是谁都那么财大气粗,用户的眼睛是雪亮的,有性价比更高的方案,谁会弃而不用呢?
英伟达在利用其垄断地位玩阴招?
因此,在英伟达更新EULA后,就如清水亮所说,“要在数据中心做深度学习项目,不管是商业的也好,学术的也罢,在日本也好,海外也罢,都必须购买高价的Tesla系列才行”,便宜又好用的GeForce系列就这样强制被罢黜了。
“这显然是英伟达(日本)在利用其垄断地位玩阴招。”清水亮这样说。
试想,为什么没有直接商业应用的学生实验或商业研究,要被迫支付合理成本的10倍?跟在游戏中使用的芯片几乎完全相同,仅仅因为放在数据中心里,价格就上涨了10倍。这里面难道没有猫腻?
作为一个《星球大战》迷,清水亮将英伟达的这一策略改动类比为“第一秩序”(First Order)的崛起。
如此热爱GPU、热爱深度学习,以及热爱《星球大战》的黄教主,竟被比作Kylo Ren?!
嗯……题外话:Kylo Ren,《星球大战》电影系列中的一名虚构反派角色他拥有强大的原力,后堕落至原力黑暗面,渴望和外祖父黑武士达斯·维达一样强大。
清水亮说,深度学习社区让英伟达获得了创纪录的利润,而这家公司如何回报深度学习社区?这就好像在说:“如果你还想继续工作,那就付我们十倍的钱。”
文章发布后,清水亮的愤怒得到了很多共鸣和回应[3]。
树大招风
作为一家商业公司,英伟达要怎么限制和授权软件使用,完全是它的自由。
同时,英伟达仅仅限制在数据中心使用GeForce做深度学习,一般的高校和研究所这样的非商业用户,并不会受什么影响。
再者,GeForce作为专门用做图形的显卡,做数据中心应用原本效率就不会太高,从数据中心这方面来说,原本购买GeForce做深度学习的可能性也不大。实际上,英伟达也一直在向数据中心客户推广稳定性更好的Tesla。
还有一种可能,就是英伟达懒得去优化GeForce做非图形应用的软件了。
不过,值得注意,英伟达的条款明确指出,虽然不准用GeForce在数据中心做深度学习,但挖矿除外,这一点可能是在针对AMD等对手,因为业界普遍认为后者在挖矿上的效率更高。
但最后,英伟达对“数据中心”也没有明确定义,企业的机房算“数据中心”吗?虽然互联网巨头看不上GeForece,但初创公司可能会用啊。
总之,这个新规定会波及不少成长当中的深度学习项目,这一点是毋庸置疑的。
还有,有时间你可以访问Reddit[3],反对(谴责)英伟达的、力挺英伟达的、怒其他芯片公司不争的……在深度学习领域,一个EULA的修改就能引发这样的波澜,除了英伟达还有几家?
原文发布时间为:2017-12-26
本文作者:闻菲
本文来自云栖社区合作伙伴新智元,了解相关信息可以关注“AI_era”微信公众号