谷歌 DeepMind 喜事连连:刚推出全能 AI 模型 Gato,又收获 GAN 之父

简介: 5 月 7 日,苹果机器学习总监 Ian Goodfellow 离职,近日据外媒报道,Ian Goodfellow 将加入谷歌人工智能研究部门 DeepMind。

不满重返办公室政策,GAN 之父加入 DeepMind

GAN 之父 Ian Goodfellow 于 2019 年 3 月加入苹果,担任“特别项目团队的机器学习的总监”。5 月初,因不满苹果公司的重返办公室政策,Ian Goodfellow 选择离职。

Ian Goodfellow 在给员工发送的电子邮件中证实了自己离职的消息,他称“我坚信,对我的团队来说,保持更大的灵活性才是最好的政策。”

据悉,苹果公司的重返办公室政策要求员工每周在办公室工作 3 天(周一、周二和周四在办公室工作),原计划从本月开始。不过,在 Ian Goodfellow 宣布离职后,苹果推迟了这项计划。

苹果日前在一份公告中表示,“我们正在延长试点的分阶段实施期,暂时每周保持两天在办公室。对于那些参与试点的人,如果您在这段时间进入办公室感到不舒服,您可以选择远程工作。”

据彭博社 5 月 17 日报道,Ian Goodfellow 将加入 Alphabet(谷歌母公司)的 DeepMind。有知情人士表示,Ian Goodfellow 跳槽到谷歌是 DeepMind 部门的一招妙棋,这让他成为了一名独立的贡献者。Ian Goodfellow 被认为是最重要的机器学习研究人员之一,这一举动可以说是一次重聚。

资料显示,Ian Goodfellow 此前曾多次在谷歌工作。早在 2013 年,Ian Goodfellow 就曾在谷歌实习过,并在 2015 年的时候成为谷歌大脑的高级研究员。随后,Ian Goodfellow 跳槽到 OpenAI。2017 年,Ian Goodfellow 重返谷歌,担任研究科学家。如若此次入职成功,那么将是他第三次入职谷歌。

Ian Goodfellow 的离职对苹果来说是极大的损失。资料显示,Ian Goodfellow 因提出了生成对抗网络(GAN)而闻名,他被誉为“GAN 之父”,甚至被推举为人工智能领域的顶级专家。

而对于谷歌人工智能研究部门 DeepMind 来说,Ian Goodfellow 的加入则是喜上加喜。因为在此之前,DeepMind 刚推出了全能 AI 模型 Gato,并认为其有望实现通用人工智能。

DeepMind 推出全能 AI 模型 Gato

5 月 12 日,DeepMind 发表论文推出全新 AI 智能体 Gato。据介绍,Gato 执行了 600 多项任务,包括聊天、写诗、玩 Atari 游戏、为图像添加字幕、用机械臂堆叠积木等等。DeepMind 称,Gato 是一个“单一的多面手代理”,其灵感来自大规模语言建模的进步,但它能做的不仅仅是生成文本。

DeepMind 将 Gato 称为“通才”系统,但在不少媒体及专家看来,Gato 在追求通用人工智能上又迈出了一大步。

DeepMind 首席研究员 Nando de Freitas 博士表示,人类显然有望在可预见的未来解决通用人工智能(AGI)这一里程碑式难题。5 月 14 日,Nando de Freitas 还专门在 Twitter 上开帖:

旁人可能有其他观点。我的观点是规模化就是一切!游戏到此结束!最重要的就是让模型更大、更安全、计算效率更高、采样速度更快、记忆机制更智能、模式更多、引入创新数据、在线/离线……等等。

只要克服了这些规模化挑战,AGI 就将成为现实。我们需要针对这些问题开展研究,例如用 S4 层改进记忆能力。至于符号系统,它们只是工具,大规模网络肯定可以轻松创建并操纵这些符号。

最后还有重要一点,@ilyasut(OpenAI 联合创始人 Ilya Sutskever)是对的 RichSutton 也是对的,但 AI 并不像他认为的那样是死路一条,而是前途光明。十年前,我从 @geoffreyhinton(谷歌研究员 GeoffreyHinton)那里意识到了这一点。Geoff 真的不可思议,能如此明确坚定地给出这个难以预测的结论。

Gato 真的能实现通用人工智能吗?

无论是 Gato、DALL-E 还是 GPT-3,都不足以面向大众提供毫不设限的公共服务。这些模型都需要配合硬过滤机制来防止输出偏见结论;更要命的是,它们连稳定输出可靠结果都做不到。

这不单是因为我们还没有找到实现 AGI 的秘诀,更因为人类智能这个问题本身太过复杂,也许根本就不存在单一且可以通过训练实现的解决方案。我们甚至无法确定即使未来有了突破性的逻辑算法,单靠规模化能不能解决这些问题。

当然,这并不是说超大规模模型没用、或者不值得探索。DeepMind、OpenAI 等研究机构的尝试非常重要,也确实代表着科学的前沿方向。但 Gato 并不代表着“游戏到此结束”,因为 Gato 本身存在一定的局限性。

“比如它执行多种任务的能力,类似于一台存储着几百款游戏的主机。内置游戏众多,但不代表它真就拥有多样的游戏方式。这并不是真正的通用 AI,只是把一大堆经过预训练的狭义模型整整齐齐捆绑在了一起。”外媒作者 Tristan Greene 评论称。

通过观察 Gato、DALL-E 和 GPT-3, Tristan Greene 认为真正的 AGI 距离人类还有几十年、甚至几百年的距离。但从另一个角度,这些前沿模型不断刷新着人类对算力的操控极限。

“在我看来,要想从当前阶段跨跃至真正的 AGI,人类显然要做出一些根本性的改变。

正如 Marcus 做出的精当总结:要想构建 AGI,我们就得从人类身上学习,学习自己如何推断和理解这个现实世界,学习自己如何表达并吸收语言和种种复杂概念。除此之外的一切假设,都是纯纯的狂妄自大。”

目录
相关文章
|
2月前
|
云安全 人工智能 自然语言处理
阿里云x硅基流动:AI安全护栏助力构建可信模型生态
阿里云AI安全护栏:大模型的“智能过滤系统”。
1832 120
|
3月前
|
人工智能 Java API
AI 超级智能体全栈项目阶段一:AI大模型概述、选型、项目初始化以及基于阿里云灵积模型 Qwen-Plus实现模型接入四种方式(SDK/HTTP/SpringAI/langchain4j)
本文介绍AI大模型的核心概念、分类及开发者学习路径,重点讲解如何选择与接入大模型。项目基于Spring Boot,使用阿里云灵积模型(Qwen-Plus),对比SDK、HTTP、Spring AI和LangChain4j四种接入方式,助力开发者高效构建AI应用。
1779 122
AI 超级智能体全栈项目阶段一:AI大模型概述、选型、项目初始化以及基于阿里云灵积模型 Qwen-Plus实现模型接入四种方式(SDK/HTTP/SpringAI/langchain4j)
|
2月前
|
人工智能 搜索推荐 程序员
当AI学会“跨界思考”:多模态模型如何重塑人工智能
当AI学会“跨界思考”:多模态模型如何重塑人工智能
324 120
|
3月前
|
机器学习/深度学习 人工智能 自然语言处理
AI Compass前沿速览:Qwen3-Max、Mixboard、Qwen3-VL、Audio2Face、Vidu Q2 AI视频生成模型、Qwen3-LiveTranslate-全模态同传大模型
AI Compass前沿速览:Qwen3-Max、Mixboard、Qwen3-VL、Audio2Face、Vidu Q2 AI视频生成模型、Qwen3-LiveTranslate-全模态同传大模型
732 13
AI Compass前沿速览:Qwen3-Max、Mixboard、Qwen3-VL、Audio2Face、Vidu Q2 AI视频生成模型、Qwen3-LiveTranslate-全模态同传大模型
|
3月前
|
人工智能 负载均衡 API
Vercel 发布 AI Gateway 神器!可一键访问数百个模型,助力零门槛开发 AI 应用
大家好,我是Immerse,独立开发者、AGI实践者。分享编程、AI干货、开源项目与个人思考。关注公众号“沉浸式趣谈”,获取独家内容。Vercel新推出的AI Gateway,统一多模型API,支持自动切换、负载均衡与零加价调用,让AI开发更高效稳定。一行代码切换模型,告别接口烦恼!
472 1
Vercel 发布 AI Gateway 神器!可一键访问数百个模型,助力零门槛开发 AI 应用
|
机器学习/深度学习 人工智能 Kubernetes
【热点】谷歌的AI协同平台
关注公众号“达摩院首座”,了解开发者最真实生活
914 0
【热点】谷歌的AI协同平台
|
2月前
|
消息中间件 人工智能 安全
云原生进化论:加速构建 AI 应用
本文将和大家分享过去一年在支持企业构建 AI 应用过程的一些实践和思考。
664 43
|
3月前
|
人工智能 安全 中间件
阿里云 AI 中间件重磅发布,打通 AI 应用落地“最后一公里”
9 月 26 日,2025 云栖大会 AI 中间件:AI 时代的中间件技术演进与创新实践论坛上,阿里云智能集团资深技术专家林清山发表主题演讲《未来已来:下一代 AI 中间件重磅发布,解锁 AI 应用架构新范式》,重磅发布阿里云 AI 中间件,提供面向分布式多 Agent 架构的基座,包括:AgentScope-Java(兼容 Spring AI Alibaba 生态),AI MQ(基于Apache RocketMQ 的 AI 能力升级),AI 网关 Higress,AI 注册与配置中心 Nacos,以及覆盖模型与算力的 AI 可观测体系。
1011 48
|
2月前
|
人工智能 运维 Kubernetes
Serverless 应用引擎 SAE:为传统应用托底,为 AI 创新加速
在容器技术持续演进与 AI 全面爆发的当下,企业既要稳健托管传统业务,又要高效落地 AI 创新,如何在复杂的基础设施与频繁的版本变化中保持敏捷、稳定与低成本,成了所有技术团队的共同挑战。阿里云 Serverless 应用引擎(SAE)正是为应对这一时代挑战而生的破局者,SAE 以“免运维、强稳定、极致降本”为核心,通过一站式的应用级托管能力,同时支撑传统应用与 AI 应用,让企业把更多精力投入到业务创新。
486 30