MIT科学家用AI设计「好奇心」算法:基于元学习探索奇妙世界

简介: 孩子们通过好奇心解锁世界。相比之下,把计算机放到新环境中通常会卡顿。为此,研究人员尝试将好奇心编码到他们的算法中,希望智能体在探索的驱动下,能够更好地了解他所处的环境。

微信图片_20220108210203.png


很多伟大的发明一开始都是好奇心驱使的。


苹果砸到牛顿头上,他开始思考为什么苹果会从树上掉下来,于是得出了万有引力定律。

微信图片_20220108210206.jpg


瓦特对烧水壶冒出的蒸汽十分好奇,最后改良了蒸汽机。因为好奇,成就了「昆虫界的荷马」法布尔。因为好奇,德莱斯发明了自行车。 数千年来,好奇心打开了人类的智慧大门。


在好奇心的驱使下,人们探索世界并从经验中学到了新技能。相比之下,把计算机放到新的环境中,有时就会出现故障。


微信图片_20220108210209.png


将「好奇心」编码到算法中


为了能让计算机更好地适应新环境,工程师们尝试将好奇心编码到算法中,希望在好奇心推动下智能体能够去更有效地探索,了解他所处的环境。


就和小孩学习新事物一样,智能体要首先从捡东西,操纵使用物体,投掷东西学起,实现了这些基本操作,学习其他事物的能力也会随之加快


工程师已发现了许多方法,能够将好奇探索机制编码到机器学习算法中。一直以来,研究人员也通过计算机来搜索新的算法。最近,麻省理工学院的一个研究小组在思考计算机在算法设计方面是否比人有优势。


近年来,深度神经网络的设计(通过调整参数来搜索解决方案的算法)已通过Google的AutoML和Python中的auto-sklearn等软件实现了自动化。这使那些非专业人士也能轻易地开发AI应用程序。


但是,尽管深度神经网络擅长做特定任务,但它们在新的环境中适用性不高。相比之下,用高级编程语言编出的算法能在不同任务和环境中迁移知识。


利用AI自动设计算法


 研究的合著者,麻省理工学院电气工程与计算机科学系,以及计算机科学与人工智能实验室(CSAIL)的研究生Ferran Alet说:「人为设计的算法非常普通。我们受到启发,使用AI来发现具有好奇心且能适应各种不同环境的算法。」


微信图片_20220108210211.png


同时,作者表示,「 我们从人和其他动物的好奇行为中汲取了灵感。假设好奇心是进化过程中探索发现的一种机制,该机制促使智能体在生命早期进行有意义的探索。这项探索使它能够在其一生学习中,不断获取经验赢得高额回报。我们将产生好奇行为的问题作为一种元学习。


研究人员创建了一种「元学习」算法,该算法生成了52,000个探索算法。他们发现最上面的两个是全新的算法,从人为角度看,似乎太明显,违反直觉了。这两种算法都产生了探索行为,从根本上改善了一系列模拟任务中的学习过程,从二维网格图像导航到机器人蚂蚁行走。由于元学习过程会输出高级计算机代码,因此可以分解这两种算法,以了解其内部决策过程。



该论文的高级作者是麻省理工学院计算机科学和电气工程学教授Lesile Kaelbling和Tomas Lozano-Perez。这项工作将在2020ICLR大会上进行具体介绍。


该论文获得了许多没有参与其中的研究人员的称赞。


Google的首席科学家Quoc Le表示,「使用程序检索来发现更好的内在奖励机制是非常有创意的,它帮助开拓了计算机辅助深度学习模型的设计。我非常喜欢这个idea,在于它的程序是可以解读的」


研究人员将自动化的算法设计过程,比作是用有限的单词来写句子的过程。他们首先选择了一组基本构建模块来定义其探索算法。在研究了其他好奇心算法以获得灵感之后,他们挑选了30多种高级操作,包括基本程序和深度学习模型,来引导智能体做一些事情,比如记住以前的输入,比较当前和过去的输入,并使用学习方法来改变自己的模块。然后,计算机一次最多可以组合7种不同操作,生成描述52,000种算法的计算图。


即使用一台快速的计算机,对所有的算法进行测试都要花费数十年的时间。因此,研究人员首先排除了那些从代码结构就预测出其性能较差的算法,来缩小范围。


然后,他们在一项基本的网格坐标导航任务上测试了那些最看好的算法,网格导航任务需要大量的探索行为,但计算量最少。如果某项算法表现良好,那么它的表现就成为新的基准,从而淘汰更多候选人。


研究人员用四台计算机搜索了10多个小时,以找到最佳算法。


结果发现,超过99%都是垃圾算法,但大约有一百种是优胜的高性能算法。


值得注意的是,前16名优胜的算法既新颖又好用,在其他虚拟任务(从登上月球车,到举起机械臂,再到移动类似蚂蚁的机器人)的性能上,都比人类设计的算法要好,至少实力相当。


所有16种算法都产生了两个基本的探索功能。


智能体会在两种情况下受到奖励:


第一种,智能体会因为访问新的地方而获得奖励,因为在那里他们有更大的机会采取新的行动。


第二种,智能体也会因为访问新地方而获得奖励,但以一种更细微的方式: 其中一个神经网络预测未来的状态,而另一个回忆过去,然后试图通过在未来回忆过去来预测现在。如果这个预测结果是错误的,那么它会奖励自己,因为这是一个信号,表明它发现了以前不知道的东西。第二种算法是如此违反直觉,以至于研究人员花了很长时间才弄明白。


「我们的偏见常常使我们无法尝试非常创新的想法,」Alet说。「但是计算机不会。他们会多多尝试,看看怎么样,有时反而会得到意想不到的出色结果。」


越来越多的研究人员转向机器学习,来设计更好的机器学习算法,这其中就包括AutoML。Google的Le和他的同事们最近推出了一款新的算法发现工具,名为Auto-ML Zero。 (它的名字是谷歌的 AutoML 软件和谷歌 DeepMind 的 Alpha Zero的结合,前者为给定的应用程序定制深层网络架构,后者可以通过自己玩数百万个游戏,来学习玩不同的棋盘游戏。)


微信图片_20220108210214.png


他们的方法是在大量的算法当中搜索原始运算更简单的算法。但是,他们的目标不是发现探索策略,而是发现能够对图像进行分类的算法。两项研究都表明,人类有能力使用机器学习方法来创建新颖的,高性能的机器学习算法。


「生成的算法可以被人类读取和解读,但是要真正理解这些代码,我们必须对每个变量和操作进行推理,以及它们如何随着时间演变,」研究合著者,麻省理工学院研究生Martin Schneider说。「设计算法和工作流程,利用计算机来评估大量算法,是一个有趣的挑战。同时我们也要来解释和改进这些想法,



参考链接:


https://www.csail.mit.edu/news/automating-search-entirely-new-curiosity-algorithms

相关文章
|
1月前
|
机器学习/深度学习 存储 人工智能
AI与量子计算:推动计算科学的边界
【10月更文挑战第7天】AI与量子计算的融合,标志着计算科学进入了一个全新的时代。在这个时代里,计算能力的边界被不断拓宽,科技创新的速度不断加快。我们有理由相信,在未来的日子里,AI与量子计算将继续携手并进,共同推动计算科学向着更加智能、更加高效的方向发展。让我们期待这一天的到来,共同见证计算科学的无限可能。
|
2月前
|
人工智能 自然语言处理 测试技术
用图灵测试检验AI尤其是大语言模型,真的科学吗?
【9月更文挑战第25天】《Does GPT-4 Pass the Turing Test?》一文评估了先进AI模型GPT-4的图灵测试表现。尽管GPT-4在某些对话中成功迷惑了参与者,但其整体成功率仅为41%,低于人类的63%。图灵测试作为评估AI语言能力的工具依然有效,但存在局限性,如无法评估AI的认知机制且受主观判断影响。此外,测试还引发了关于AI智能及伦理的讨论。
151 6
|
2月前
|
机器学习/深度学习 人工智能 数据可视化
首个全自动科学发现AI系统,Transformer作者创业公司Sakana AI推出AI Scientist
【9月更文挑战第11天】Sakana AI公司近日推出全球首个全自动科学发现AI系统——AI Scientist,实现了人工智能在科学研究领域的重大突破。AI Scientist不仅能独立完成从假设提出到实验设计、数据分析及论文撰写的全过程,还能通过模拟评审提升研究成果的质量。该系统已成功应用于机器学习的多个子领域,并产出达到顶级会议标准的论文。尽管其高效性备受赞誉,但也引发了关于研究可信度和潜在风险的讨论。Sakana AI强调,系统具备可追溯的决策过程与严格的评审机制,确保了研究的可靠性和透明度。论文详情参见:[链接]。
75 6
|
4天前
|
人工智能 知识图谱
成熟的AI要学会自己搞研究!MIT推出科研特工
MIT推出科研特工SciAgents,结合生成式AI、本体表示和多代理建模,实现科学发现的自动化。通过大规模知识图谱和多代理系统,SciAgents能探索新领域、识别复杂模式,加速新材料发现,展现跨学科创新潜力。
26 12
|
15天前
|
人工智能
AI科学家太多,谁靠谱一试便知!普林斯顿新基准CORE-Bench:最强模型仅有21%准确率
【10月更文挑战第21天】普林斯顿大学研究人员提出了CORE-Bench,一个基于计算可重复性的AI代理基准,涵盖计算机科学、社会科学和医学领域的270个任务。该基准旨在评估AI代理在科学研究中的准确性,具有多样性、难度级别和现实相关性等特点,有助于推动AI代理的发展并提高计算可重复性。
35 4
|
23天前
|
机器学习/深度学习 人工智能 算法
"拥抱AI规模化浪潮:从数据到算法,解锁未来无限可能,你准备好迎接这场技术革命了吗?"
【10月更文挑战第14天】本文探讨了AI规模化的重要性和挑战,涵盖数据、算法、算力和应用场景等方面。通过使用Python和TensorFlow的示例代码,展示了如何训练并应用一个基本的AI模型进行图像分类,强调了AI规模化在各行业的广泛应用前景。
27 5
|
1月前
|
人工智能 自然语言处理
召唤100多位学者打分,斯坦福新研究:AI科学家创新确实强
【10月更文挑战第6天】斯坦福大学最新研究评估了大型语言模型(LLMs)在生成新颖研究想法方面的能力,通过100多位NLP专家盲评LLMs与人类研究人员提出的想法。结果显示,LLMs在新颖性方面超越人类(p < 0.05),但在可行性上略逊一筹。研究揭示了LLMs作为科研工具的潜力与挑战,并提出了进一步验证其实际效果的设计。论文详见:https://arxiv.org/abs/2409.04109。
38 6
|
1月前
|
机器学习/深度学习 人工智能 开发框架
【AI系统】AI 学习方法与算法现状
在人工智能的历史长河中,我们见证了从规则驱动系统到现代机器学习模型的转变。AI的学习方法基于深度神经网络,通过前向传播、反向传播和梯度更新不断优化权重,实现从训练到推理的过程。当前,AI算法如CNN、RNN、GNN和GAN等在各自领域取得突破,推动技术进步的同时也带来了更大的挑战,要求算法工程师与系统设计师紧密合作,共同拓展AI技术的边界。
72 1
|
1月前
|
人工智能 自然语言处理 机器人
MIT新研究揭秘AI洗脑术!AI聊天诱导人类编造记忆,真假难辨
麻省理工学院的一项新研究《基于大型语言模型的对话式AI在证人访谈中加剧虚假记忆》显示,使用生成式聊天机器人进行犯罪证人访谈会显著增加参与者的虚假记忆,且影响持久。研究设置了对照组、问卷访谈、预设脚本及生成式聊天机器人四种条件,结果显示生成式聊天机器人诱导的虚假记忆数量远超其他方法。尽管AI技术在效率和准确性方面潜力巨大,但在敏感领域需谨慎应用,并需进一步评估风险,制定伦理准则和监管措施。论文详细内容见[这里](https://arxiv.org/abs/2408.04681)。
39 2
|
25天前
|
人工智能 算法 前端开发
无界批发零售定义及无界AI算法,打破传统壁垒,累积数据流量
“无界批发与零售”是一种结合了批发与零售的商业模式,通过后端逻辑、数据库设计和前端用户界面实现。该模式支持用户注册、登录、商品管理、订单处理、批发与零售功能,并根据用户行为计算信用等级,确保交易安全与高效。