谷歌 DeepMind 喜事连连:刚推出全能 AI 模型 Gato,又收获 GAN 之父

简介: 5 月 7 日,苹果机器学习总监 Ian Goodfellow 离职,近日据外媒报道,Ian Goodfellow 将加入谷歌人工智能研究部门 DeepMind。

不满重返办公室政策,GAN 之父加入 DeepMind

GAN 之父 Ian Goodfellow 于 2019 年 3 月加入苹果,担任“特别项目团队的机器学习的总监”。5 月初,因不满苹果公司的重返办公室政策,Ian Goodfellow 选择离职。

Ian Goodfellow 在给员工发送的电子邮件中证实了自己离职的消息,他称“我坚信,对我的团队来说,保持更大的灵活性才是最好的政策。”

据悉,苹果公司的重返办公室政策要求员工每周在办公室工作 3 天(周一、周二和周四在办公室工作),原计划从本月开始。不过,在 Ian Goodfellow 宣布离职后,苹果推迟了这项计划。

苹果日前在一份公告中表示,“我们正在延长试点的分阶段实施期,暂时每周保持两天在办公室。对于那些参与试点的人,如果您在这段时间进入办公室感到不舒服,您可以选择远程工作。”

据彭博社 5 月 17 日报道,Ian Goodfellow 将加入 Alphabet(谷歌母公司)的 DeepMind。有知情人士表示,Ian Goodfellow 跳槽到谷歌是 DeepMind 部门的一招妙棋,这让他成为了一名独立的贡献者。Ian Goodfellow 被认为是最重要的机器学习研究人员之一,这一举动可以说是一次重聚。

资料显示,Ian Goodfellow 此前曾多次在谷歌工作。早在 2013 年,Ian Goodfellow 就曾在谷歌实习过,并在 2015 年的时候成为谷歌大脑的高级研究员。随后,Ian Goodfellow 跳槽到 OpenAI。2017 年,Ian Goodfellow 重返谷歌,担任研究科学家。如若此次入职成功,那么将是他第三次入职谷歌。

Ian Goodfellow 的离职对苹果来说是极大的损失。资料显示,Ian Goodfellow 因提出了生成对抗网络(GAN)而闻名,他被誉为“GAN 之父”,甚至被推举为人工智能领域的顶级专家。

而对于谷歌人工智能研究部门 DeepMind 来说,Ian Goodfellow 的加入则是喜上加喜。因为在此之前,DeepMind 刚推出了全能 AI 模型 Gato,并认为其有望实现通用人工智能。

DeepMind 推出全能 AI 模型 Gato

5 月 12 日,DeepMind 发表论文推出全新 AI 智能体 Gato。据介绍,Gato 执行了 600 多项任务,包括聊天、写诗、玩 Atari 游戏、为图像添加字幕、用机械臂堆叠积木等等。DeepMind 称,Gato 是一个“单一的多面手代理”,其灵感来自大规模语言建模的进步,但它能做的不仅仅是生成文本。

DeepMind 将 Gato 称为“通才”系统,但在不少媒体及专家看来,Gato 在追求通用人工智能上又迈出了一大步。

DeepMind 首席研究员 Nando de Freitas 博士表示,人类显然有望在可预见的未来解决通用人工智能(AGI)这一里程碑式难题。5 月 14 日,Nando de Freitas 还专门在 Twitter 上开帖:

旁人可能有其他观点。我的观点是规模化就是一切!游戏到此结束!最重要的就是让模型更大、更安全、计算效率更高、采样速度更快、记忆机制更智能、模式更多、引入创新数据、在线/离线……等等。

只要克服了这些规模化挑战,AGI 就将成为现实。我们需要针对这些问题开展研究,例如用 S4 层改进记忆能力。至于符号系统,它们只是工具,大规模网络肯定可以轻松创建并操纵这些符号。

最后还有重要一点,@ilyasut(OpenAI 联合创始人 Ilya Sutskever)是对的 RichSutton 也是对的,但 AI 并不像他认为的那样是死路一条,而是前途光明。十年前,我从 @geoffreyhinton(谷歌研究员 GeoffreyHinton)那里意识到了这一点。Geoff 真的不可思议,能如此明确坚定地给出这个难以预测的结论。

Gato 真的能实现通用人工智能吗?

无论是 Gato、DALL-E 还是 GPT-3,都不足以面向大众提供毫不设限的公共服务。这些模型都需要配合硬过滤机制来防止输出偏见结论;更要命的是,它们连稳定输出可靠结果都做不到。

这不单是因为我们还没有找到实现 AGI 的秘诀,更因为人类智能这个问题本身太过复杂,也许根本就不存在单一且可以通过训练实现的解决方案。我们甚至无法确定即使未来有了突破性的逻辑算法,单靠规模化能不能解决这些问题。

当然,这并不是说超大规模模型没用、或者不值得探索。DeepMind、OpenAI 等研究机构的尝试非常重要,也确实代表着科学的前沿方向。但 Gato 并不代表着“游戏到此结束”,因为 Gato 本身存在一定的局限性。

“比如它执行多种任务的能力,类似于一台存储着几百款游戏的主机。内置游戏众多,但不代表它真就拥有多样的游戏方式。这并不是真正的通用 AI,只是把一大堆经过预训练的狭义模型整整齐齐捆绑在了一起。”外媒作者 Tristan Greene 评论称。

通过观察 Gato、DALL-E 和 GPT-3, Tristan Greene 认为真正的 AGI 距离人类还有几十年、甚至几百年的距离。但从另一个角度,这些前沿模型不断刷新着人类对算力的操控极限。

“在我看来,要想从当前阶段跨跃至真正的 AGI,人类显然要做出一些根本性的改变。

正如 Marcus 做出的精当总结:要想构建 AGI,我们就得从人类身上学习,学习自己如何推断和理解这个现实世界,学习自己如何表达并吸收语言和种种复杂概念。除此之外的一切假设,都是纯纯的狂妄自大。”

目录
相关文章
|
29天前
|
人工智能 测试技术 API
AI计算机视觉笔记二十 九:yolov10竹签模型,自动数竹签
本文介绍了如何在AutoDL平台上搭建YOLOv10环境并进行竹签检测与计数。首先从官网下载YOLOv10源码并创建虚拟环境,安装依赖库。接着通过官方模型测试环境是否正常工作。然后下载自定义数据集并配置`mycoco128.yaml`文件,使用`yolo detect train`命令或Python代码进行训练。最后,通过命令行或API调用测试训练结果,并展示竹签计数功能。如需转载,请注明原文出处。
|
22天前
|
机器学习/深度学习 人工智能 UED
OpenAI o1模型:AI通用复杂推理的新篇章
OpenAI发布了其最新的AI模型——o1,这款模型以其独特的复杂推理能力和全新的训练方式,引起了业界的广泛关注。今天,我们就来深入剖析o1模型的特点、背后的原理,以及一些有趣的八卦信息。
229 73
|
17天前
|
存储 人工智能 算法
阿里云AI基础设施升级亮相,模型算力利用率提升超20%
阿里云AI基础设施升级亮相,模型算力利用率提升超20%
118 18
|
14天前
|
人工智能 搜索推荐 安全
【通义】AI视界|苹果和谷歌受罚,欧盟监管部门“连斩”美国科技巨头。
苹果前设计官乔尼·艾夫确认正与OpenAI合作开发AI硬件,结合其设计经验与OpenAI技术,预期将推出革新智能设备。同时,苹果和谷歌因税务与垄断问题遭欧盟处罚,显示欧盟加强监管科技巨头。此外,新版Siri将在AI加持下于明年推出,提供更流畅的交互体验。微软则与上海医疗机构合作,运用AI辅助阿尔茨海默症治疗。最后,三哩岛核电站重启以满足微软数据中心的电力需求。
|
24天前
|
人工智能 自动驾驶 云计算
【通义】AI视界|谷歌大模型被盯上!欧盟最高隐私监管机构对PaLM2模型展开调查~
本文汇总了近24小时内科技领域的五大要闻:欧盟对谷歌PaLM2模型启动隐私合规调查;甲骨文推出Zettascale云计算集群,集成大量NVIDIA GPU强化计算力;红杉资本偏好AI应用投资而非模型构建;夸克新推智能助手CueMe,支持长达2万字内容生成;沃尔沃与NVIDIA合作,未来车型将采用后者先进芯片提升自动驾驶功能。以上内容由通义自动生成。
|
26天前
|
机器学习/深度学习 人工智能 供应链
【通义】AI视界|OpenAI的“草莓”模型预计两周内上线!像人类一样思考!
本文介绍了近期科技领域的五大亮点:OpenAI即将推出的新一代AI模型“草莓”,具备高级推理能力;亚马逊测试AI技术加速有声读物生产,通过语音克隆提高效率;Kimi API新增联网搜索功能,拓宽信息来源;顺丰发布物流行业专用大语言模型“丰语”,提升工作效率;钉钉推出“AI班级群”功能,改善家校沟通体验。更多详情,请访问[通义官网]。
|
1月前
|
人工智能 自然语言处理 数据挖掘
【通义】AI视界|性能超越GPT-4o?最强大的开源AI模型来了……
本文介绍了五项最新AI技术动态,包括性能超越GPT-4o的开源AI模型Reflection70B、智谱清言App限时免费的视频通话功能、哈佛医学院研发的癌症诊断AI模型CHIEF、Replit推出的AI编程助手,以及英特尔与日本AIST合作设立的芯片制造研发中心。这些进展展示了AI领域的快速创新与广泛应用。更多详情,请访问通义官网体验。
|
29天前
|
人工智能 测试技术 PyTorch
AI计算机视觉笔记二十四:YOLOP 训练+测试+模型评估
本文介绍了通过正点原子的ATK-3568了解并实现YOLOP(You Only Look Once for Panoptic Driving Perception)的过程,包括训练、测试、转换为ONNX格式及在ONNX Runtime上的部署。YOLOP由华中科技大学团队于2021年发布,可在Jetson TX2上达到23FPS,实现了目标检测、可行驶区域分割和车道线检测的多任务学习。文章详细记录了环境搭建、训练数据准备、模型转换和测试等步骤,并解决了ONNX转换过程中的问题。
|
1月前
|
人工智能 自然语言处理 安全
【通义】AI视界|谷歌推出AI搜索功能“问照片”,照片一问即得……
本文汇总了AI领域的最新动态,包括谷歌推出的“问照片”功能,使用户能用自然语言检索Google Photos;OpenAI的商业用户激增及ChatGPT的广泛应用;Anthropic发布的企业级AI助手Claude Enterprise;美英欧盟首个人工智能法律约束条约;OpenAI前首席科学家新公司获巨额融资;以及比尔·盖茨对AI前景的乐观展望与安全建议。
|
10天前
|
人工智能 自然语言处理 Linux
Llama 3.2:开源可定制视觉模型,引领边缘AI革命
Llama 3.2 系列 11B 和 90B 视觉LLM,支持图像理解,例如文档级理解(包括图表和图形)、图像字幕以及视觉基础任务(例如基于自然语言描述在图像中精确定位对象)。

热门文章

最新文章

下一篇
无影云桌面