谷歌 DeepMind 喜事连连:刚推出全能 AI 模型 Gato,又收获 GAN 之父

简介: 5 月 7 日,苹果机器学习总监 Ian Goodfellow 离职,近日据外媒报道,Ian Goodfellow 将加入谷歌人工智能研究部门 DeepMind。

不满重返办公室政策,GAN 之父加入 DeepMind

GAN 之父 Ian Goodfellow 于 2019 年 3 月加入苹果,担任“特别项目团队的机器学习的总监”。5 月初,因不满苹果公司的重返办公室政策,Ian Goodfellow 选择离职。

Ian Goodfellow 在给员工发送的电子邮件中证实了自己离职的消息,他称“我坚信,对我的团队来说,保持更大的灵活性才是最好的政策。”

据悉,苹果公司的重返办公室政策要求员工每周在办公室工作 3 天(周一、周二和周四在办公室工作),原计划从本月开始。不过,在 Ian Goodfellow 宣布离职后,苹果推迟了这项计划。

苹果日前在一份公告中表示,“我们正在延长试点的分阶段实施期,暂时每周保持两天在办公室。对于那些参与试点的人,如果您在这段时间进入办公室感到不舒服,您可以选择远程工作。”

据彭博社 5 月 17 日报道,Ian Goodfellow 将加入 Alphabet(谷歌母公司)的 DeepMind。有知情人士表示,Ian Goodfellow 跳槽到谷歌是 DeepMind 部门的一招妙棋,这让他成为了一名独立的贡献者。Ian Goodfellow 被认为是最重要的机器学习研究人员之一,这一举动可以说是一次重聚。

资料显示,Ian Goodfellow 此前曾多次在谷歌工作。早在 2013 年,Ian Goodfellow 就曾在谷歌实习过,并在 2015 年的时候成为谷歌大脑的高级研究员。随后,Ian Goodfellow 跳槽到 OpenAI。2017 年,Ian Goodfellow 重返谷歌,担任研究科学家。如若此次入职成功,那么将是他第三次入职谷歌。

Ian Goodfellow 的离职对苹果来说是极大的损失。资料显示,Ian Goodfellow 因提出了生成对抗网络(GAN)而闻名,他被誉为“GAN 之父”,甚至被推举为人工智能领域的顶级专家。

而对于谷歌人工智能研究部门 DeepMind 来说,Ian Goodfellow 的加入则是喜上加喜。因为在此之前,DeepMind 刚推出了全能 AI 模型 Gato,并认为其有望实现通用人工智能。

DeepMind 推出全能 AI 模型 Gato

5 月 12 日,DeepMind 发表论文推出全新 AI 智能体 Gato。据介绍,Gato 执行了 600 多项任务,包括聊天、写诗、玩 Atari 游戏、为图像添加字幕、用机械臂堆叠积木等等。DeepMind 称,Gato 是一个“单一的多面手代理”,其灵感来自大规模语言建模的进步,但它能做的不仅仅是生成文本。

DeepMind 将 Gato 称为“通才”系统,但在不少媒体及专家看来,Gato 在追求通用人工智能上又迈出了一大步。

DeepMind 首席研究员 Nando de Freitas 博士表示,人类显然有望在可预见的未来解决通用人工智能(AGI)这一里程碑式难题。5 月 14 日,Nando de Freitas 还专门在 Twitter 上开帖:

旁人可能有其他观点。我的观点是规模化就是一切!游戏到此结束!最重要的就是让模型更大、更安全、计算效率更高、采样速度更快、记忆机制更智能、模式更多、引入创新数据、在线/离线……等等。

只要克服了这些规模化挑战,AGI 就将成为现实。我们需要针对这些问题开展研究,例如用 S4 层改进记忆能力。至于符号系统,它们只是工具,大规模网络肯定可以轻松创建并操纵这些符号。

最后还有重要一点,@ilyasut(OpenAI 联合创始人 Ilya Sutskever)是对的 RichSutton 也是对的,但 AI 并不像他认为的那样是死路一条,而是前途光明。十年前,我从 @geoffreyhinton(谷歌研究员 GeoffreyHinton)那里意识到了这一点。Geoff 真的不可思议,能如此明确坚定地给出这个难以预测的结论。

Gato 真的能实现通用人工智能吗?

无论是 Gato、DALL-E 还是 GPT-3,都不足以面向大众提供毫不设限的公共服务。这些模型都需要配合硬过滤机制来防止输出偏见结论;更要命的是,它们连稳定输出可靠结果都做不到。

这不单是因为我们还没有找到实现 AGI 的秘诀,更因为人类智能这个问题本身太过复杂,也许根本就不存在单一且可以通过训练实现的解决方案。我们甚至无法确定即使未来有了突破性的逻辑算法,单靠规模化能不能解决这些问题。

当然,这并不是说超大规模模型没用、或者不值得探索。DeepMind、OpenAI 等研究机构的尝试非常重要,也确实代表着科学的前沿方向。但 Gato 并不代表着“游戏到此结束”,因为 Gato 本身存在一定的局限性。

“比如它执行多种任务的能力,类似于一台存储着几百款游戏的主机。内置游戏众多,但不代表它真就拥有多样的游戏方式。这并不是真正的通用 AI,只是把一大堆经过预训练的狭义模型整整齐齐捆绑在了一起。”外媒作者 Tristan Greene 评论称。

通过观察 Gato、DALL-E 和 GPT-3, Tristan Greene 认为真正的 AGI 距离人类还有几十年、甚至几百年的距离。但从另一个角度,这些前沿模型不断刷新着人类对算力的操控极限。

“在我看来,要想从当前阶段跨跃至真正的 AGI,人类显然要做出一些根本性的改变。

正如 Marcus 做出的精当总结:要想构建 AGI,我们就得从人类身上学习,学习自己如何推断和理解这个现实世界,学习自己如何表达并吸收语言和种种复杂概念。除此之外的一切假设,都是纯纯的狂妄自大。”

目录
相关文章
|
1天前
|
人工智能 安全 测试技术
EXAONE 3.5:LG 推出的开源 AI 模型,采用 RAG 和多步推理能力降低模型的幻觉问题
EXAONE 3.5 是 LG AI 研究院推出的开源 AI 模型,擅长长文本处理,能够有效降低模型幻觉问题。该模型提供 24 亿、78 亿和 320 亿参数的三个版本,支持多步推理和检索增强生成技术,适用于多种应用场景。
25 9
EXAONE 3.5:LG 推出的开源 AI 模型,采用 RAG 和多步推理能力降低模型的幻觉问题
|
3天前
|
机器学习/深度学习 人工智能
SNOOPI:创新 AI 文本到图像生成框架,提升单步扩散模型的效率和性能
SNOOPI是一个创新的AI文本到图像生成框架,通过增强单步扩散模型的指导,显著提升模型性能和控制力。该框架包括PG-SB和NASA两种技术,分别用于增强训练稳定性和整合负面提示。SNOOPI在多个评估指标上超越基线模型,尤其在HPSv2得分达到31.08,成为单步扩散模型的新标杆。
36 10
SNOOPI:创新 AI 文本到图像生成框架,提升单步扩散模型的效率和性能
|
3天前
|
人工智能 搜索推荐 开发者
Aurora:xAI 为 Grok AI 推出新的图像生成模型,xAI Premium 用户可无限制访问
Aurora是xAI为Grok AI助手推出的新图像生成模型,专注于生成高逼真度的图像,特别是在人物和风景图像方面。该模型支持文本到图像的生成,并能处理包括公共人物和版权形象在内的多种图像生成请求。Aurora的可用性因用户等级而异,免费用户每天能生成三张图像,而Premium用户则可享受无限制访问。
33 11
Aurora:xAI 为 Grok AI 推出新的图像生成模型,xAI Premium 用户可无限制访问
|
5天前
|
存储 人工智能 PyTorch
【AI系统】模型转换流程
本文详细介绍了AI模型在不同框架间的转换方法,包括直接转换和规范式转换两种方式。直接转换涉及从源框架直接生成目标框架的模型文件,而规范式转换则通过一个中间标准格式(如ONNX)作为桥梁,实现模型的跨框架迁移。文中还提供了具体的转换流程和技术细节,以及模型转换工具的概览,帮助用户解决训练环境与部署环境不匹配的问题。
17 5
【AI系统】模型转换流程
|
5天前
|
机器学习/深度学习 存储 人工智能
【AI系统】模型转换基本介绍
模型转换技术旨在解决深度学习模型在不同框架间的兼容性问题,通过格式转换和图优化,将训练框架生成的模型适配到推理框架中,实现高效部署。这一过程涉及模型格式转换、计算图优化、算子统一及输入输出支持等多个环节,确保模型能在特定硬件上快速、准确地运行。推理引擎作为核心组件,通过优化阶段和运行阶段,实现模型的加载、优化和高效执行。面对不同框架的模型文件格式和网络结构,推理引擎需具备高度的灵活性和兼容性,以支持多样化的应用场景。
18 4
【AI系统】模型转换基本介绍
|
5天前
|
机器学习/深度学习 人工智能 算法
【AI系统】模型压缩基本介绍
模型压缩旨在通过减少存储空间、降低计算量和提高计算效率,降低模型部署成本,同时保持模型性能。主要技术包括模型量化、参数剪枝、知识蒸馏和低秩分解,广泛应用于移动设备、物联网、在线服务系统、大模型及自动驾驶等领域。
27 4
【AI系统】模型压缩基本介绍
|
5天前
|
机器学习/深度学习 存储 人工智能
【AI系统】模型剪枝
本文概述了模型剪枝的概念、方法及流程,旨在通过移除神经网络中冗余或不重要的参数,实现模型规模的减小和效率的提升。剪枝不仅有助于降低模型的存储和计算需求,还能增强模型的泛化能力。文章详细介绍了剪枝的定义、分类、不同阶段的剪枝流程,以及多种剪枝算法,如基于参数重要性的方法、结构化剪枝、动态剪枝和基于优化算法的全局剪枝策略。通过这些方法,可以在保持模型性能的同时,显著提高模型的计算速度和部署灵活性。
17 2
【AI系统】模型剪枝
|
机器学习/深度学习 人工智能 算法
DeepMind的AI学会了画画,利用强化学习完全不需人教
如何让计算机自动模仿梵高油画?DeepMind给出了一个强化学习的方法。通过给强化学习算法设定报酬函数,反复调整算法参数,使得报酬最大,DeepMind的AI完全自学地学会了绘画。本文带来大数医达创始人邓侃博士的解读。
16051 0
|
1天前
|
机器学习/深度学习 人工智能 自然语言处理
转载:【AI系统】AI的领域、场景与行业应用
本文概述了AI的历史、现状及发展趋势,探讨了AI在计算机视觉、自然语言处理、语音识别等领域的应用,以及在金融、医疗、教育、互联网等行业中的实践案例。随着技术进步,AI模型正从单一走向多样化,从小规模到大规模分布式训练,企业级AI系统设计面临更多挑战,同时也带来了新的研究与工程实践机遇。文中强调了AI基础设施的重要性,并鼓励读者深入了解AI系统的设计原则与研究方法,共同推动AI技术的发展。
转载:【AI系统】AI的领域、场景与行业应用
|
1天前
|
人工智能 缓存 异构计算
云原生AI加速生成式人工智能应用的部署构建
本文探讨了云原生技术背景下,尤其是Kubernetes和容器技术的发展,对模型推理服务带来的挑战与优化策略。文中详细介绍了Knative的弹性扩展机制,包括HPA和CronHPA,以及针对传统弹性扩展“滞后”问题提出的AHPA(高级弹性预测)。此外,文章重点介绍了Fluid项目,它通过分布式缓存优化了模型加载的I/O操作,显著缩短了推理服务的冷启动时间,特别是在处理大规模并发请求时表现出色。通过实际案例,展示了Fluid在vLLM和Qwen模型推理中的应用效果,证明了其在提高模型推理效率和响应速度方面的优势。
云原生AI加速生成式人工智能应用的部署构建