专访 Jordan 高徒 Percy Liang:如何开发连续学习的智能体

本文涉及的产品
NLP自然语言处理_基础版,每接口每天50万次
NLP自然语言处理_高级版,每接口累计50万次
NLP 自学习平台,3个模型定制额度 1个月
简介:

新智元:IJCAI-16大会让你感受最深的是什么?可以给我们举一两个例子吗?


Liang:作为各种机器学习和自然语言处理大会的常客,我这还是第一次参加IJCAI大会。我感触最深的就是世界太大了。在IJCAI大会上,对同一个AI主题感兴趣的人有很多,而我是第一次遇到这种情况。像博弈论、逻辑编程这些主题,在IJCAI大会上得到的讨论要比在许多机器学习大会上更加全面。我一直相信,多接触其他主题有助于扩大自己的世界观,还能为自己的研究指出新方向。所以,IJCAI 大会在这方面让我很满意。


新智元:你的团队正在进行什么项目?其中最难的部分是什么,为什么?


Liang:我的团队正在开展好几个关于学习和语言的不同项目,也遇到了一些困难。最难的当属深度自然语言理解。语言真的是非常强大:仅仅通过使用语言,我就能告诉你怎么去火车站、让你理解某个数学定理,写出一份合同等等。然而,要理解的不仅仅是语言,还要理解这个世界,要理解语言是如何帮助你做出行动和理解世界的。我越是深入研究语言,就越是认识到问题不在于语言而在于世界。所以说这很困难,因为世界是一个混乱又复杂的地方。


第二个难点是关于学习的,但是与学习算法或是模式关联很少,而是与学习环境密切相关。大多数机器学习都是通过定义任务、收集训练数据(输入-输出对)、设计模型、学习这一过程来操作的。然而,人类的学习方式则完全不同。所有事情都是交互的、直接的(online),在现实世界中做出行动和观察学习是交错进行的,而最重要的是——我们人能随时间的推移结构化地成长。我们学会爬行、走路、说话、阅读、解决问题、与人互动、管理公司、写诗。这些都发生在一个连续的过程,而不是基于一组“任务”。而我们要怎样才能开发出能以这种方式学习的智能体呢?


语言不仅是AI应用,也是智能的要素


新智元:《纽约时报》曾发表一篇文章说,机器人只要保持沉默就能通过图灵测试。你怎么看待图灵测试?你认为图灵测试到底是什么?


Liang:图灵测试是一个哲学思想实验,用来判断一个人能否确定机器是否会思考。我认为,用图灵测试的通过率来直接衡量人工智能研究的进展是错误的,这完全是两码事。


话虽如此,我认为,从图灵测试中我们能学到三件事。第一,图灵测试测的,是一个系统的行为,而不是它的内在机制。我认为这种客观性在研究中是有益的,我们不应该在意识形态的基础上争论方法论。第二,图灵测试是交互的。我认为与人类的互动对于人工智能而言是最重要的。但是,现在的大多数系统,尤其是基于机器学习的系统,都是非交互的。第三,图灵测试的对象是人工智能,但是使用的是自然语言。我认为,自然语言不仅仅是人工智能的一个应用,它对智能来说也非常重要。这就是我热衷研究语言的一个主要原因。


新智元:你在研究过程中遇到过的最大灵感或突破是什么(what is your biggest eureka moment in research)?


Liang:我的回答可能不算是答案,但是事情就是如此。你不可能某一天坐在苹果树下或是浴缸里,然后灵感就一闪而过,所有事情就想清楚了。做研究是一个渐进的过程。你要尝试很多事情,每一件事都回给你多一点的见解。当你终于证明一个定理或者证明某个实验可行,你感到非常激动,但是要把这个功劳归于产生灵感那一刻是不公平的。因为你是在成功之前,经历了很长的一个过程,你付出了很多努力,尝试了各种事情。


新智元:你为什么会选择研究NLP?


Liang:我一直对语言非常感兴趣。我记得在我上高中的时候,我曾努力想理解自己是如何理解语言的。当然,这非常难,因为语言理解是一个自然的过程,大部分都是下意识完成的。但这也许是一个早期迹象,表示我真的想去通过某种方法理解语言理解这个神秘而美丽的过程,尽管当时我对此知之甚少。


当我在MIT读本科时,我一开始研究的是算法(因为我当时参加了算法编程竞赛,自然就选择了这个方向)。之后,我了解了机器学习,这就促使我在 Michael Collins 指导下攻读自然语言处理硕士学位。就是那时,我看到了统计技术的力量,于是我立即全身心投入到NLP的研究中去。


新智元:IJCAI Research Excellence Award 旨在奖励那些贯穿其职业生涯,坚持从事高品质研究项目,并得出众多实质性科研成果的科学家,该奖项获得者都是人工智能领域的顶尖科学家。今年 IJCAI Research Excellence Award 得主 Micheal I. Jordan,他与 Dan Klein 都曾是你的博士生导师。他们两位都是人工智能领域的优秀研究员。你在与 Jordan 教授一起工作时,印象最深刻的是什么?与 Klein 教授呢?


Liang:能有这两位导师,我真的很幸运。我不仅从他们各自的身上学到了很多,而且,我从他们那里学到的东西是互补的,而且不仅仅是在研究领域(机器学习和NLP)。


Mike 的知识领域非常广。他热衷于学习多个学科——生物学、计算机科学、统计学等。而且,他学完材料后就能教授新的课程。他还有一种神奇的能力,能极其清楚地认识这个世界,从纷繁复杂的数学知识点钟,提炼出观点的精华。


Dan 对于经验性问题有着非常好的直觉。他教会我如何理解数据。他对于建立模型和发展技巧有非常高端、独到的审美。我还从 Dan 身上学到了很多关于写作、展示、教学和提建议的技能,这些都给我带来了极大的帮助。


个人更愿意留在学术界做长期基础研究


新智元:人工智能人才从学界流向业界已经成为一种趋势。你对此有什么看法?假如谷歌要给你一份理想的工作,你会接受还是拒绝?为什么?


Liang:毫无疑问,现在的产业界比学术界更吸引人工智能研究。但是,从长远看,我肯定是要留在斯坦福大学。首先,要解释一下产业[研究]是什么。大部分的产业[研究]都是短期的,最终是要帮助公司[盈利]。虽然大多数的研究实验室(像百度、亚马逊和谷歌的一部分)眼光比较长,但是其根本关注点仍然是发展对一部分产品有用的技术。产业研究在攻克难题,对社会也有很大的影响。


而我个人一直对长期问题更感兴趣,喜欢思考要开发有效、可靠的系统,我们必须克服的最大困难是什么。学界能给你自由,让你专注于研究长期的根本性问题。我也很喜欢和学生一起工作,他们总是充满活力、有新的想法、热衷学习。我认为,这是培育新想法最好的环境。当然,还有少数地方(比如谷歌 DeepMind、Facebook AI Research、Open AI)也注重长期研究,和学术界环境很像,但是,不清楚这些地方到底能存在多久。


新智元:你在ICML'16组织了一个研讨会“Reliable ML in the Wild”,邀请机器人技术、自动驾驶系统控制等其他领域的研究人员共同探讨如何开发可靠的机器学习技术。我们能从这种跨学科的方式中获得哪些推进机器学习的概念或者方法呢?


Liang:首先,我要解释一下这个研讨会的背景。机器学习在不断发展。当我还在读研究生的时候,机器学习的领域还不算大,人们做一些有趣的研究,都只是实验阶段——当时也有一些重大的应用,但是受的约束比较多,处于“in vivo”状态。而现在呢,情况完全不同。在极短的时间内,机器学习就被到处应用,而且,这一趋势将继续下去。


我和我的学生 Jacob Steinhardt 都意识到,还有许多重要的问题需要解决:当测试条件与训练的时候大不相同时会发生什么?系统能否 fail gracefully(编注:指程序检测到致命错误时,留下记录并自动退出)或者学会适应?我们应当如何应对机器学习反对者?这些问题,我们现在还没有好的答案。这个研讨会的目的是,把研究与可靠的机器学习相关主题(比如领域适应、安全强化学习、因果关系)的研究人员聚到一起,尝试建立起联系、形成一个团体。


新智元:你认为 NLP 和 ML 在3 到 5年后会是什么样?为什么?


Liang:这是令人激动的时期。几年后,我们将会看到越来越多的应用。一方面,这对学术研究而言是成功的,但是另一方面,事情还没有结束。我们的研究仍有许多棘手的问题有待解决。我们不仅要开发更强大的性能,而且要采用可靠的方式。随着 ML和 NLP 进一步投入使用,诸如安全、保障、隐私、透明和解释等问题将变得越来越重要。 


新智元:你是 IJCAI'16 Computers and Thought Award 得主,能跟我们的读者分享一下获奖感受吗?


Liang:当然。获奖让我十分激动,但看着这个奖以前的获奖者名单,里面不乏当前人工智能领域的代表,有时候也让我压力很大。但同时这也是一种很好的激励——接下来在我职业生涯中,还有很长的时间供我努力去推动并塑造领域的发展。


文章转自新智元公众号,原文链接

相关文章
|
4月前
|
JSON JavaScript 数据可视化
开发 CNode 技术社区智能体
CNode 社区是国内最大的 Node.js 开源技术社区,致力于 Node.js 技术研究。本文基于 Botnow 平台,通过创建 Bot、插件及工作流,详细介绍了如何利用 CNode 社区的开放 API 构建智能体,并最终发布上线,实现智能化交互功能。
|
8月前
|
物联网 测试技术 API
LLM 大模型学习必知必会系列(九):Agent微调最佳实践,用消费级显卡训练属于自己的Agent!
LLM 大模型学习必知必会系列(九):Agent微调最佳实践,用消费级显卡训练属于自己的Agent!
LLM 大模型学习必知必会系列(九):Agent微调最佳实践,用消费级显卡训练属于自己的Agent!
|
4月前
|
机器学习/深度学习 算法 自动驾驶
深度学习之分布式智能体学习
基于深度学习的分布式智能体学习是一种针对多智能体系统的机器学习方法,旨在通过多个智能体协作、分布式决策和学习来解决复杂任务。这种方法特别适用于具有大规模数据、分散计算资源、或需要智能体彼此交互的应用场景。
222 4
|
3月前
|
人工智能 安全 机器人
Dify开发Agent对接钉钉机器人
这篇文章详细讲解了如何在Dify平台上开发一个Agent并与钉钉机器人集成,实现自动化消息处理和响应功能。
260 0
|
5月前
|
机器学习/深度学习 人工智能 Linux
【机器学习】Dify:AI智能体开发平台版本升级
【机器学习】Dify:AI智能体开发平台版本升级
323 0
|
5月前
|
人工智能 Kubernetes Cloud Native
AI智能体研发之路-工程篇(一):Docker助力AI智能体开发提效
AI智能体研发之路-工程篇(一):Docker助力AI智能体开发提效
64 0
|
6月前
|
机器学习/深度学习 算法 数据挖掘
Python强化学习应用于数据分析决策策略:** - 强化学习让智能体通过环境互动学习决策。
【7月更文挑战第5天】**Python强化学习应用于数据分析决策策略:** - 强化学习让智能体通过环境互动学习决策。 - Python因丰富库(如TensorFlow, PyTorch, Keras, Pandas, NumPy)和生态而受青睐。 - 使用OpenAI Gym构建环境,如`gym.make('CartPole-v0')`。 - 选择模型,例如神经网络,定义策略如Q-Learning。 - 训练模型,调整智能体行为,如Q-Learning更新Q表。 - 最后评估模型性能,实现数据驱动决策。
57 3
|
8月前
|
物联网 PyTorch 测试技术
LLM 大模型学习必知必会系列(十):基于AgentFabric实现交互式智能体应用,Agent实战
LLM 大模型学习必知必会系列(十):基于AgentFabric实现交互式智能体应用,Agent实战
LLM 大模型学习必知必会系列(十):基于AgentFabric实现交互式智能体应用,Agent实战
|
6月前
|
机器学习/深度学习 算法 Python
强化学习(Reinforcement Learning, RL)** 是一种机器学习技术,其中智能体(Agent)通过与环境(Environment)交互来学习如何执行决策以最大化累积奖励。
强化学习(Reinforcement Learning, RL)** 是一种机器学习技术,其中智能体(Agent)通过与环境(Environment)交互来学习如何执行决策以最大化累积奖励。
|
8月前
|
监控 Java Maven
揭秘Java Agent技术:解锁Java工具开发的新境界
作为JDK提供的关键机制,Java Agent技术不仅为Java工具的开发者提供了一个强大的框架,还为性能监控、故障诊断和动态代码修改等领域带来了革命性的变革。本文旨在全面解析Java Agent技术的应用场景以及实现方式,特别是静态加载模式和动态加载模式这两种关键模式。
1497 0