思考总结10年,图灵奖得主Yann LeCun指明下一代AI方向:自主机器智能(2)

简介: 思考总结10年,图灵奖得主Yann LeCun指明下一代AI方向:自主机器智能

设计和训练世界模型

毫不夸张的说,未来几十年阻碍人工智能发展的真正障碍是为世界模型设计架构以及训练范式。本文的主要贡献之一正是分层架构和世界模型的训练,可以在预测中表示多个结果。

训练世界模型是自监督学习(SSL)中的一个典型例子,其基本思想是模式补全。对未来输入(或暂时未观察到的输入)的预测是模式补全的一个特例。在这项工作中,世界模型旨在预测世界状态未来表征。

自监督学习

自监督学习 (SSL) 作为一种范式,可用来训练学习系统以捕获输入之间的相互依赖关系。具体来说,这通常归结为训练一个系统来告诉其输入的各个部分是否彼此一致。

本文还介绍了一种基于能量的模型(EBM)架构,如图 8 所示,数据点是黑点,能量函数在数据点周围产生低能量值,并在远离高数据密度区域的区域产生较高能量,如能量等高线所示。

自监督学习 (SSL) 和基于能量的模型 (EBM)


联合嵌入预测架构(JEPA)

本文的核心是联合嵌入预测架构 (JEPA)。JEPA 不是生成式的,因为它不能轻易地用于从 x 预测 y。它仅捕获 x 和 y 之间的依赖关系,而不显式生成 y 的预测。图 12 显示了一个通用 JEPA。


与 EBM 一样,可以使用对比方法训练 JEPA。但是,对比方法在高维空间中效率很低。本文设计出了非对比方法来训练它们,在 JEPA 的情况下,可以通过四个标准来完成,如图 13 所示:1. 最大化 s_x 关于 x 的信息量;2. 最大化 s_y 关于 y 的信息量;3. 使 s_y 容易从 s_x 中预测;4. 最小化用于预测潜在变量 z 的信息含量。


分层 JEPA (H-JEPA)

图 15 显示了多级、多尺度下世界状态预测的可能架构,变量 x_0, x_1, x_2 表示一系列观察值。第一级网络表示为 JEPA-1,使用低级表征执行短期预测。第二级网络 JEPA-2 使用高级表征进行长期预测。研究者可以设想这种类型的架构有许多层,可能会使用卷积和其他模块,并使用级之间的时间池来粗粒度的表示和执行长期的预测。使用 JEPA 的任何非对比方法,可以进行 level-wise 或全局的训练。


分层规划

分层规划比较困难,几乎没有解决方案,大多数都需要预先定义动作的中间词汇。图 16 显示了分层模式 2 规划的可能架构,该架构可以利用多尺度世界模型的分层特性。


图 17 表示了不确定情况下的分层规划阶段。


文章最后,LeCun 表示文中许多观点是多年来与不同研究者互动的结晶。了解更多内容,请查看原论文。

相关文章
|
人工智能 数据管理 大数据
阿里云数据库走向Serverless与AI驱动的一站式数据平台是一个很有前景和意义的发展方向
阿里云数据库走向Serverless与AI驱动的一站式数据平台是一个很有前景和意义的发展方向
265 2
|
机器学习/深度学习 人工智能
AI模型提早5年预警乳腺癌,MIT研究登Science获LeCun转发
【9月更文挑战第1天】麻省理工学院(MIT)研究人员开发的深度学习AI模型,在乳腺癌早期预警方面取得突破性进展,相比传统方法提前5年预警癌症,准确率超过90%。此成果不仅在医学界引起轰动,还获得了人工智能领域知名学者Yann LeCun的高度评价。尽管面临准确性和可解释性的挑战,但该研究展示了AI在医疗领域的巨大潜力,有望革新乳腺癌的早期筛查和诊断方式。论文详情见[链接]。
265 3
|
机器学习/深度学习 人工智能 算法
【AI 场景】在自主武器中使用人工智能的伦理影响
【5月更文挑战第4天】【AI 场景】在自主武器中使用人工智能的伦理影响
【AI 场景】在自主武器中使用人工智能的伦理影响
|
机器学习/深度学习 人工智能 机器人
Meta首席科学家Yann LeCun:AI毁灭人类的概率为零
【2月更文挑战第22天】Meta首席科学家Yann LeCun:AI毁灭人类的概率为零
306 2
Meta首席科学家Yann LeCun:AI毁灭人类的概率为零
|
机器学习/深度学习 人工智能 知识图谱
LeCun视觉世界模型论文,揭示AI学习物理世界的关键
【2月更文挑战第16天】LeCun视觉世界模型论文,揭示AI学习物理世界的关键
224 2
LeCun视觉世界模型论文,揭示AI学习物理世界的关键
|
机器学习/深度学习 人工智能 监控
Spring Boot与AI机器学习技术探索方向和实施方
Spring Boot与AI机器学习技术探索方向和实施方
576 0
|
人工智能 API 开发工具
【Auto-GPT】会自主完成任务的 AI!安整的安装&使用教学
【Auto-GPT】会自主完成任务的 AI!安整的安装&使用教学
|
4月前
|
消息中间件 人工智能 安全
云原生进化论:加速构建 AI 应用
本文将和大家分享过去一年在支持企业构建 AI 应用过程的一些实践和思考。
1103 50
|
5月前
|
人工智能 安全 中间件
阿里云 AI 中间件重磅发布,打通 AI 应用落地“最后一公里”
9 月 26 日,2025 云栖大会 AI 中间件:AI 时代的中间件技术演进与创新实践论坛上,阿里云智能集团资深技术专家林清山发表主题演讲《未来已来:下一代 AI 中间件重磅发布,解锁 AI 应用架构新范式》,重磅发布阿里云 AI 中间件,提供面向分布式多 Agent 架构的基座,包括:AgentScope-Java(兼容 Spring AI Alibaba 生态),AI MQ(基于Apache RocketMQ 的 AI 能力升级),AI 网关 Higress,AI 注册与配置中心 Nacos,以及覆盖模型与算力的 AI 可观测体系。
1193 58
|
4月前
|
人工智能 运维 Kubernetes
Serverless 应用引擎 SAE:为传统应用托底,为 AI 创新加速
在容器技术持续演进与 AI 全面爆发的当下,企业既要稳健托管传统业务,又要高效落地 AI 创新,如何在复杂的基础设施与频繁的版本变化中保持敏捷、稳定与低成本,成了所有技术团队的共同挑战。阿里云 Serverless 应用引擎(SAE)正是为应对这一时代挑战而生的破局者,SAE 以“免运维、强稳定、极致降本”为核心,通过一站式的应用级托管能力,同时支撑传统应用与 AI 应用,让企业把更多精力投入到业务创新。
601 30

热门文章

最新文章