Science:AI竞赛,学界正在输给业界

简介: Science:AI竞赛,学界正在输给业界

人工智能(AI)正在向业界倾斜。相比于学界的前沿性研究,风靡当下的 AI 聊天机器人 ChatGPT、AI 艺术生成器 Midjourney,以及微软发布的新一代 AI 驱动搜索引擎 New Bing、谷歌发布 ChatGPT 竞品 Bard 和那些未来将要发布的“类 ChatGPT”等,似乎正在预示着一场更大、更系统的变革。


尽管消费者能够从业界的这些成果中受益,但伴随而来的是全球决策者的担忧——重要 AI 工具的公共科技替代品可能会越来越稀缺。


2023 年 3 月 3 日,来自麻省理工学院、弗吉尼亚理工大学的研究团队在权威科学期刊 Science 上发文,阐述了业界在“数据、算力与人才”方面的优势,并探讨了业界的这些优势可能带来的隐患,以及可行的对策。


学术头条在不改变文章原意的前提下,对原文进行了精简与编译。




几十年来,AI 研究在学界和业界并存,但随着深度学习成为该领域的领先技术,平衡正在向业界倾斜。我们常常看到业界 AI 的成功,如 DALL·E 2、ChatGPT、new Bing 等。


然而,这些头条新闻预示着一场更大、更系统的变革:业界正在占据 AI 研究的主导地位,从大型数据集、计算能力和高技能研究人员三方面支配着 AI 投入。这种支配正在转化为一系列研究成果:业界在学术出版物、尖端模型和关键基准方面的影响力越来越大。尽管消费者能够从中受益,但伴随而来的是全球决策者的担忧——重要 AI 工具的公共科技替代品可能会越来越稀缺。


业界的投入优势:数据、算力与人才


业界长期以来更能够访问大型、具有经济价值的数据集,因为大量用户与设备交互时会自然而然地产生数据。例如,在 2020 年,WhatsApp 美国用户每天发送大约 1000 亿条消息。然而,业界的主导地位除了凸显在数据之外,更是扩展到了现代 AI 的其他关键投入:人才和计算能力。


在过去十年中,AI 人才的需求骤升导致了 AI 人才竞争的加剧。然而,业界正在赢得这场竞赛。来自北美州的众多大学的数据显示,专门研究 AI 的计算机科学(CS)博士毕业生正以前所未有的数量进入业界。2004 年,只有 21% 的 AI 博士进入业界,但到 2020 年,这一数量占比高达 70%。



专门研究 AI 的 CS 研究人员也从大学被聘请到业界工作。自 2006 年以来,这一招聘人数增长了 8 倍,远高于 CS 研究人员的整体增长。这种担忧并不局限于美国的大学。在英国,华威大学国王十字校区院长 Abhinay Muthoo 表示,“顶尖的科技公司正在汲取大学的精华”。



学界和业界的算力使用也呈现出越来越大的差距。在图像分类中,业界使用的算力比学界或业界-学界合作使用的更大,并且增长更快。研究运用参数数量(所需算力的关键决定因素之一)来代替模型中使用的计算能力。2021 年,业界模型的平均规模是学界的 29 倍,突显出两组计算能力的巨大差异。



业界雇佣人才和利用更大算力的能力很可能是造成 AI 研究成果差异的原因。虽然公共和私营部门在 AI 方面的投资都在大幅增加,但业界的投资更大、增长更快。2021 年,非国防的美国政府机构在 AI 行业拨款 15 亿美元。同年,欧盟委员会计划支出 10 亿欧元。


相比之下,同年全球范围内,业界在 AI 上的支出超过了 3400 亿美元,大大超过了公共投资。例如,2019 年,谷歌母公司 Alphabet 在其子公司 DeepMind 上花费了 15 亿美元,这只是其 AI 投资的一部分。在欧洲,这一差距较小,但仍然存在;AI Watch 估计,“私营和公共部门分别占欧盟 AI 投资的 67% 和 33%”。


开展 AI 研究所需资金规模的一个例子来自 OpenAI,它最初是一个非营利组织,声称“不受产生财务回报的约束”,旨在“造福整个人类”。四年后,OpenAI 将其定位改为“有上限的营利组织”,并宣布这一改变将使他们“迅速增加对算力和人才方面的投资”。


业界在 AI 研究中日益占据主导地位


如今,业界对 AI 输入的主导地位表现在 AI 成果的日益突出,尤其是在研究发布、创建最大模型和超越关键基准方面。在主要 AI 会议上,由一位或多位业界联合作者撰写的研究论文从 2000 年的 22% 增长到 2020 年的 38%;业界在最大的 AI 模型中所占份额已从 2010 年的 11% 上升到 2021 年的 96%。



在 AI 基准方面,纵观图像识别、语义分析、语言建模、语义分割、对象检测和机器翻译 6 个方面,以及涵盖机器人和常识推理等领域的另外 14 项基准,在 2017 年之前,业界单独或与大学合作,有 62% 的时间处于领先地位。自 2020 年以来,这一比例已上升到 91%。



因此,通过在领先的研究机构发表文章、建立最先进的 AI 模型以及超越关键基准三个方面衡量,分析表明,业界在 AI 产出方面的地位越来越突出。


业界的压倒性优势带来隐患


业界对 AI 的投资不断增加,可能通过技术的商业化为社会带来巨大利益。公司可以创造更好的产品,使消费者受益——机器翻译有利于国际贸易,并能简化流程降低成本。业界对 AI 的投资还产生了对整个社区有价值的工具。例如,学界广泛使用的 PyTorch 和 TensorFlow,促进深度学习模型高效训练的硬件如 TPU,以及可公开访问的预训练模型——Meta 的 OPT 模型。


与此同时,AI 在业界中的集中也令人担忧,业界的商业动机促使他们关注以盈利为导向的话题。如果所有的前沿模型都来自业界,就会出现不存在具有公共意识的替代品的情况。换句话来说,“优先部门的 AI 研究人员倾向于专注于数据要求高和计算密集的深度学习方法”是以“涉及其他 AI 方法的研究、考虑 AI 的社会和伦理影响的研究以及在健康等领域的应用”为代价的。


AI 的发展轨迹如何?谁来控制它?AI 会替代人类吗并引发不平等吗?一些研究人员担心,“我们可能正走向社会次优轨迹,它更侧重于替代人类劳动,而不是增强人类能力。”一些人展开想象:业界和学界可能会形成与其他学科类似的分工:基础研究主要由大学完成,而应用研究和开发则主要由业界完成。


然而,在 AI 领域,产学的明确分工并不存在。业界所使用的应用模型往往是那些突破基础研究边界的模型。例如,transformer 是由谷歌大脑研究人员于 2017 年开发的一种深度学习架构,使得基础研究向前迈出重要一步,并且几乎立即应用于业界使用。尽管这意味着学术工作可以直接惠及业界,但是应用工作的业界主导权也赋予了它决定基础研究方向的权力。


鉴于 AI 工具可以在整个社会中得到广泛的应用,这种情况将使少数技术公司在社会发展方向拥有巨大的权力。对于世界上许多人来说,这种担忧进一步加剧,因为这些组织对他们来说是“外国公司”。例如,生命未来研究所认为,“欧洲公司没有开发通用 AI 系统,而且由于他们与美国和中国公司相比在竞争上处于相对劣势,不太可能很快开始开发”。


学界重塑 AI 前沿的可行之路


通过对业界 AI 的审查或外部监督,监管可能是解决方案。例如,2018 年,学者 Joy Buolamwini 和 Timnit Gebru 记录了商业人脸识别系统中的性别和种族偏见。然而,如果学界不能接触到业界的 AI 系统,或者没有资源来开发竞争模型,他们解释业界模型或提供公共利益的替代方案的能力将受到限制。


这既是因为学界无法建立尖端性能所需的大型模型,也是因为 AI 系统的一些有用的能力似乎是“涌现”的——系统只有在特别大的时候才能获得这些能力。模型的一些负面特征似乎也随着规模的增加而扩大。例如,AI 生成的语言中的毒性以及刻板印象。在任何一种情况下,没有足够资源的学者都无法对这些重要领域做出有意义的贡献。


在全球范围内,这种对学界在 AI 研究中的资源劣势的担忧正在被认识到,并开始出现政策应对措施。在美国,NAIRR 工作组提议创建公共研究云和公共数据集。在加拿大,国家高级研究计算平台一直在为该国的学界服务,自从近十年前启动以来,一直被超额使用。


对许多国家来说,这类投资所需的规模可能令人望而生畏。在这种情况下,决策者面临的关键问题将是,他们是否能够与志同道合的合作者一起筹集足够的资源,以达到创建反映自己优先事项的 AI 系统所需的规模。


算力并不是提供补救措施的唯一领域,构建公共数据集将非常重要。但是,这并非易事,因为现代 AI 训练数据集可以是数十亿份文档。特别值得关注的是,创建没有直接商业利益的重要数据集,以及提供资源让顶尖 AI 研究人员留在学界。例如,加拿大研究主席计划(CRCP)通过提供工资和研究基金吸引加拿大顶尖人才。


对于致力于这一问题的决策者来说,目标应该是确保有足够的能力来帮助审查或监控业界模型,或生产出符合公众利益的替代模型。


有了这些能力,学界可以继续塑造现代 AI 研究的前沿,并为负责任的 AI 制定基准。若没有这些能力,重要的公众兴趣 AI 工作将被抛弃。


相关文章
|
9天前
|
人工智能 数据挖掘
AI长脑子了?LLM惊现人类脑叶结构并有数学代码分区,MIT大牛新作震惊学界!
麻省理工学院的一项新研究揭示了大型语言模型(LLM)内部概念空间的几何结构,与人脑类似。研究通过分析稀疏自编码器生成的高维向量,发现了概念空间在原子、大脑和星系三个层次上的独特结构,为理解LLM的内部机制提供了新视角。论文地址:https://arxiv.org/abs/2410.19750
50 12
|
3月前
|
机器学习/深度学习 人工智能
AI模型提早5年预警乳腺癌,MIT研究登Science获LeCun转发
【9月更文挑战第1天】麻省理工学院(MIT)研究人员开发的深度学习AI模型,在乳腺癌早期预警方面取得突破性进展,相比传统方法提前5年预警癌症,准确率超过90%。此成果不仅在医学界引起轰动,还获得了人工智能领域知名学者Yann LeCun的高度评价。尽管面临准确性和可解释性的挑战,但该研究展示了AI在医疗领域的巨大潜力,有望革新乳腺癌的早期筛查和诊断方式。论文详情见[链接]。
61 3
|
7月前
|
机器学习/深度学习 人工智能 自然语言处理
清华首款AI光芯片登上Science,全球首创架构迈向AGI
【4月更文挑战第16天】清华大学研究团队开发出大规模光子芯片“太极”,在《科学》杂志发表,该芯片基于创新的光子计算架构,实现百万神经元级别的ONN,能效比高达160 TOPS/W。实验中,太极芯片成功执行1000类别分类任务,提升AI内容生成质量,为AGI发展开辟新路径。然而,光子集成电路的制造成本高、技术成熟度不足及软件支持限制了其广泛应用。
175 5
清华首款AI光芯片登上Science,全球首创架构迈向AGI
|
7月前
|
机器学习/深度学习 人工智能
辉瑞 AI 方法登 Science,揭示数以万计的配体-蛋白质相互作用
【5月更文挑战第15天】辉瑞研究人员在《Science》发表论文,利用深度学习模型PLIN预测和分析数以万计的蛋白质-配体相互作用,有望加速药物研发,提高药物效果和安全性。实验显示模型在1000多对数据上表现良好,但对复杂相互作用和泛化能力仍有待改进。[链接](https://www.science.org/doi/10.1126/science.adk5864)
54 3
|
机器学习/深度学习 人工智能 文字识别
用AI攻克“智能文字识别创新赛题”,这场大学生竞赛掀起了什么风潮?
用AI攻克“智能文字识别创新赛题”,这场大学生竞赛掀起了什么风潮?
163 0
用AI攻克“智能文字识别创新赛题”,这场大学生竞赛掀起了什么风潮?
|
7月前
|
机器学习/深度学习 人工智能 Java
【AI for Science】量子化学:分子属性预测-第2次打卡-特征工程baseline上分
【AI for Science】量子化学:分子属性预测-第2次打卡-特征工程baseline上分
|
7月前
|
机器学习/深度学习 数据采集 人工智能
【AI for Science】量子化学:分子属性预测-第1次打卡-机器学习baseline
【AI for Science】量子化学:分子属性预测-第1次打卡-机器学习baseline
|
人工智能 自然语言处理 算法
如果本次亚运会有 AI 竞赛项目,那会是什么项目?
如果本次亚运会有 AI 竞赛项目,那会是什么项目?
66 0
|
机器学习/深度学习 人工智能 自然语言处理
7 Papers & Radios | 无残差连接训练深度transformer;DeepMind写代码AI登Science封面
7 Papers & Radios | 无残差连接训练深度transformer;DeepMind写代码AI登Science封面
129 0
|
4天前
|
机器学习/深度学习 人工智能 自然语言处理
AI技术深度解析:从基础到应用的全面介绍
人工智能(AI)技术的迅猛发展,正在深刻改变着我们的生活和工作方式。从自然语言处理(NLP)到机器学习,从神经网络到大型语言模型(LLM),AI技术的每一次进步都带来了前所未有的机遇和挑战。本文将从背景、历史、业务场景、Python代码示例、流程图以及如何上手等多个方面,对AI技术中的关键组件进行深度解析,为读者呈现一个全面而深入的AI技术世界。
50 10
下一篇
DataWorks