“Google只认钱!机器学习20年没进步”,CMU学者炮轰AI第一大厂

简介: 这几天,一位耿直的CMU学者Simon DeDeo,在在Twitter上猛烈炮轰Google Brain团队,对营利性机器学习行业展开嘲讽。(其实也顺便无情抨击了Facebook的研究机构。)

“机器学习是一个了不起的工程成就。但这不是科学,远远不是。”

“这技术现在所做的事情,跟1990年没什么差别,顶多就是规模更大,但并没有给我们带来比20年前更深刻的见解。”

“Google比很多大学厉害,唯一的原因是他们的每个研究人员,能够比别人多雇佣十倍以上的研究生。”

“在Google,一切都是商业计划。”

“你会身处机器学习的最前沿,但,这只是一个工程学科。所有的基本目标都是大公司设定的,你不可能成为一名科学家。”

这几天,一位耿直的CMU学者Simon DeDeo,在在Twitter上猛烈炮轰Google Brain团队,对营利性机器学习行业展开嘲讽。(其实也顺便无情抨击了Facebook的研究机构。)

他批评这些大企业专注人工智能,只是为了获取更多的钱、利润,而不是为了推动科学的进步。这些观点引发了广泛关注。

用著名媒体TNW的话来说,这是一场史诗级的讨论。

赞成和反驳之声齐飞。但身处暴风中心的Google AI负责人Jeff Dean没有发声。不过,Facebook的首席AI科学家Yann LeCun站了出来。

开炮

事情的起因是这样的。

本来一堆人(又)在批评Facebook。或曰Facebook应该拆分,包括WhatsApp、Instagram等,不应都在扎克伯格一手掌握之中。

讨论过程中,Simon DeDeo说AT&T和Facebook最大的区别是:贝尔实验室发明了C语言、UNIX、晶体管、量子霍尔效应、宇宙微波背景辐射等;而Facebook Research发明了让你上瘾社交网络的新方法。

听闻这话,有人插嘴问说:你批评了Facebook的研究机构,那你怎么评价Google Brain,或者其他科学家云集的实验室?

就是这么一问,楼歪了,人炸了。

image


△ Simon DeDeo本尊

Simon DeDeo仿佛是清了清嗓子,说:既然问起来,那就说点真话。毕竟。我不需要Google的赞助,我的职业生涯也不用巴结他们。

随后,他继续连发了30多条推文,组成一篇檄文。主要说了这些话:

我在贝叶斯时代长大。那时科学家们用一些简单、理论驱动的方程改变着我们对世界的看法。后来我也以此为标准。

2010年左右,深度学习变得不可忽视。

这令人兴奋。我们在研究所里听到访者讲解决策树、随机森林等等各种其妙的事情。我也尝试用过这些新方法,但老实说,它们吸引力不大,因为其他更简单的工具就能胜任非常非常多的任务。

后来我加入印第安纳大学,当时我们热切希望招到一个搞深度学习的人。我带所有的应聘者去吃早餐,想搞明白深度学习到底是什么。

基本结论就是:没什么什么好答案。不管你搞什么,基本就是一个人坐在那里,各种调整参数。

机器学习是一个了不起的工程成就。但这不是科学,远远不是。这技术现在所做的事情,跟1990年没什么差别,顶多就是规模更大,但并没有给我们带来比20年前更深刻的见解。

image

Google比很多大学厉害,唯一的原因是他们的每个研究人员,能够比别人多雇佣十倍以上的研究生。但大学里的研究更有学术意义。

他们不知道自己在做什么。Google有足够的人力把深度学习应用于一切的一切,目标就是找到可以产生最大影响力的领域。

我访问过大约50所大学,所到之处皆有新收获。而当我到访企业的“研究”实验室时,情况完全不同。

你能在Google Brain搞一些很酷的研究么?老实说,不能。你会身处机器学习的最前沿,但,这只是一个工程学科。所有的基本目标都是大公司设定的,你不可能成为一名科学家。

如果你想构建一个监控别人,并且向他们推销更多广告的机器,那你就去企业的实验室吧。

如果你想赚钱,那里可以挣很多。在学术界不行。

image

但如果你的思想和灵魂,想成为推动人类智慧进步的动力,你最好别去Google,当然更别去Facebook了。

我建议你来学校读研,成为一个博士。你不会得到丰厚的收入,但会得到真正关心你的导师。

一个优秀的博士生导师,不会干涉学生的所思所想,这是可耻的。而在Google,一切都是商业计划。

这不是开玩笑。是我的十年经验总结。秋天又该开始新的研究生入学申请了,建议你好好想想自己何去何从。

最后说个故事。我们之前访问了Google Research,那里的人聪明的不可思议。我们一起头脑风暴出了好多精彩的学术研究思路。会面的最后一天,高校的学者说:OK!我们去酒吧,再具体讨论一下!

Google的人说:这几天对我们来说相当于度假,手上的实际的工作已经落下了,这个周末必须加班赶工。

是的,聊聊学术对他们来说,就像一个假期。

反击

这一块大石头,激起了千层浪。

Oren Etzioni,艾伦人工智能研究所(AI2)的CEO,评价说:DeDeo的炮轰把事情简单化了,而且充斥冒犯,但也的确发人深省。

image

“有意思。不少人都持有这种鲜明而挑衅的言论。他们错得很有意思。”一位身在Google Brain的访问学者Charles Sutton反驳说。随后,他继续为“工程”两个字辩护,并指出机器学习亦有诸多进步。

在reddit上,网友们也展开热议。

有人说,DeDeo只是在Google Research里遇到一些不以研究为导向的人,并据此对所有工业界的实验室进行了概括。然后以DeepMind为例说明,只有Google这样的企业,才能花钱押注几十年后的技术。

网友jbcraigs也持反对意见。他说Google有大量的部分都在做纯粹的学术研究,从2013年以来,Geoffrey Hinton一直为Google工作,没有“领导”告诉他应该研究什么,其他Google的研究人员也是如此。

有人很疑惑:企业投入巨资进行基础研究的动机是什么?

“其中一个重要因素是PR。企业到了一定规模,支持10名学者随意展开研究的成本几乎微不足道,但却能吸引更多的人才,提高自身的声誉。”网友NichG从这个角度给出了自己的看法。

尽管外界的争议沸沸扬扬,但Google AI(包括Google Research)的负责人Jeff Dean目前仍未作出任何回应。

倒是Facebook的首席AI科学家Yann LeCun,按捺不住反击了下。他对DeDeo说:

image

你被严重误导了。

没错,Google Brain很多工作都是专注工程和应用。

但是,FAIR、DeepMind以及很多Google Brain面向研究的部门,的的确确在进行实际的科学研究。

其实,以上这种工程和学术的争论,由来已久,内外皆有。

你还记得么?去年Google Brain团队的科学家Denny Britz,曾经发文吐槽深度学习:瓶颈就是太不重视工程!

我之前读研搞NLP和信息提取的时候,大部分时间,都用来把科研想法变成代码。当时可能95%的研究生和导师们都不愿意碰代码。当我提出对某个问题的疑问时,得到的回复通常是:“这只是一个工程问题,先掠过吧”。

后来我才知道,这种说辞的潜台词是:我不认为一篇与此有关的论文,能够通过同行评审。这种心态在学术界的人中似乎普遍存在。但作为一个工程师,我不禁注意到,缺乏工程实践产生的阻碍。

当然另一种意见也不缺乏。

去年NIPS期间,获得“Test of Time”最具时间价值论文大奖的Ali Rahimi(阿里·拉希米),登台演讲,并朝着整个深度学习界开了一枪:机器学习已经成了炼金术。

我希望我所生活的世界里,这些系统都建立在严格、周密、可验证的知识之上,而不是基于“炼金术”。

我不排斥使用一些自己不懂的技术,比如说我是坐飞机来的,并不完全清楚它的工作原理,但知道有整个航空界都在研究这项技术就很安心了。

但阿里话锋一转,他说很多构建深度神经网络的一些基础工具,“我们对它几乎一无所知”。他批评机器学习太工程,而缺乏理论支撑。

当然,当时LeCun也照例跳出来反对。

那件事的详情,可以通过这个传送门回顾。

image

OMT

在这次的争论里,你持什么意见?

以及,到底Google Brain在研究什么?如果你感兴趣,这有一些参考资料。

Google Brain的2017年度总结

Google Brain AMA(2017)

Google Brain揭秘:20大研究领域

就酱~

原文发布时间为:2018-07-16
本文来自云栖社区合作伙伴“ 量子位”,了解相关信息可以关注“ 量子位”。

相关文章
|
6月前
|
人工智能 自然语言处理 IDE
模型微调不再被代码难住!PAI和Qwen3-Coder加速AI开发新体验
通义千问 AI 编程大模型 Qwen3-Coder 正式开源,阿里云人工智能平台 PAI 支持云上一键部署 Qwen3-Coder 模型,并可在交互式建模环境中使用 Qwen3-Coder 模型。
1106 109
|
10月前
|
机器学习/深度学习 人工智能 供应链
从概念到商业价值:AI、机器学习与深度学习全景指南
在这个科技飞速发展的时代🚀,人工智能正以惊人的速度渗透到我们的生活和工作中👀。但面对铺天盖地的AI术语和概念,很多人感到困惑不已😣。"AI"、"机器学习"、"深度学习"和"神经网络"到底有什么区别?它们如何相互关联?如何利用这些技术提升工作效率和创造价值?
535 0
|
8月前
|
机器学习/深度学习 人工智能 监控
AI 基础知识从0.1到0.2——用“房价预测”入门机器学习全流程
本系列文章深入讲解了从Seq2Seq、RNN到Transformer,再到GPT模型的关键技术原理与实现细节,帮助读者全面掌握Transformer及其在NLP中的应用。同时,通过一个房价预测的完整案例,介绍了算法工程师如何利用数据训练模型并解决实际问题,涵盖需求分析、数据收集、模型训练与部署等全流程。文章适合初学者和开发者学习AI基础与实战技能。
1005 25
AI 基础知识从0.1到0.2——用“房价预测”入门机器学习全流程
|
9月前
|
人工智能 监控 测试技术
云上AI推理平台全掌握 (1):PAI-EAS LLM服务一键压测
在AI技术飞速发展的今天,大语言模型(LLM)、多模态模型等前沿技术正深刻改变行业格局。推理服务是大模型从“实验室突破”走向“产业级应用”的必要环节,需直面高并发流量洪峰、低延时响应诉求、异构硬件优化适配、成本精准控制等复杂挑战。 阿里云人工智能平台 PAI 致力于为用户提供全栈式、高可用的推理服务能力。在本系列技术专题中,我们将围绕分布式推理架构、Serverless 弹性资源全球调度、压测调优和服务可观测等关键技术方向,展现 PAI 平台在推理服务侧的产品能力,助力企业和开发者在 AI 时代抢占先机,让我们一起探索云上 AI 推理的无限可能,释放大模型的真正价值!
|
9月前
|
机器学习/深度学习 PyTorch API
昇腾AI4S图机器学习:DGL消息传递接口的PyG替换
DGL (Deep Graph Learning) 和 PyG (Pytorch Geometric) 是两个主流的图神经网络库,它们在API设计和底层实现上有一定差异,在不同场景下,研究人员会使用不同的依赖库,昇腾NPU对PyG图机器学习库的支持亲和度更高,因此有些时候需要做DGL接口的PyG替换。
|
9月前
|
机器学习/深度学习 PyTorch API
昇腾AI4S图机器学习:DGL图构建接口的PyG替换
本文探讨了在图神经网络中将DGL接口替换为PyG实现的方法,重点以RFdiffusion蛋白质设计模型中的SE3Transformer为例。SE3Transformer通过SE(3)等变性提取三维几何特征,其图构建部分依赖DGL接口。文章详细介绍了两个关键函数的替换:`make_full_graph` 和 `make_topk_graph`。前者构建完全连接图,后者生成k近邻图。通过PyG的高效实现(如`knn_graph`),我们简化了图结构创建过程,并调整边特征处理逻辑以兼容不同框架,从而更好地支持昇腾NPU等硬件环境。此方法为跨库迁移提供了实用参考。
|
12月前
|
机器学习/深度学习 人工智能 自然语言处理
AI训练师入行指南(三):机器学习算法和模型架构选择
从淘金到雕琢,将原始数据炼成智能珠宝!本文带您走进数字珠宝工坊,用算法工具打磨数据金砂。从基础的经典算法到精密的深度学习模型,结合电商、医疗、金融等场景实战,手把手教您选择合适工具,打造价值连城的智能应用。掌握AutoML改装套件与模型蒸馏术,让复杂问题迎刃而解。握紧算法刻刀,为数字世界雕刻文明!
428 6
|
12月前
|
机器学习/深度学习 人工智能 自然语言处理
AI训练师入行指南(四):模型训练
本文以“从璞玉到珍宝”为喻,深入探讨AI模型训练的全过程。数据集是灵魂原石,领域适配性、质量和规模决定模型高度;优化器如刻刀手法,学习率调整和正则化确保精细雕刻;超参数优化与多模态注意力机制提升性能。通过案例解析(如DeepSeek-Chat、通义千问),展示特定数据如何塑造专属能力。最后提供避坑工具箱,涵盖过拟合解决与资源不足应对策略,强调用`torch.save()`记录训练历程,助力打造智能传世之作。
1131 0
|
机器学习/深度学习 存储 搜索推荐
利用机器学习算法改善电商推荐系统的效率
电商行业日益竞争激烈,提升用户体验成为关键。本文将探讨如何利用机器学习算法优化电商推荐系统,通过分析用户行为数据和商品信息,实现个性化推荐,从而提高推荐效率和准确性。
656 14

热门文章

最新文章

推荐镜像

更多