重磅 | 揭秘IARPA项目:解码大脑算法或将彻底改变机器学习

简介:

联邦政府情报部门资助了一个非常有野心的新项目,旨在让人工智能更加符合我们自己的脑力力量(metal powers)。

联邦政府情报部门资助了一个非常有野心的新项目,旨在让人工智能更加符合我们自己的脑力力量(metal powers)。由神经学专家和计算机科学专家组成的三支队伍将试图搞清楚大脑是如何完成这些视觉识别壮举,然后让机器也能完成这样的任务。如今的机器学习在人类擅长的领域是失败,通过对大脑算法和计算方式的逆向工程研究,彻底改变机器学习。

带一个3岁小孩去动物园,当她看到正在吃树叶的长脖子动物,她就本能的知道这是绘画书上的长颈鹿。表面看起来非常容易的事情,实际上相当复杂。书上的卡通绘画只是简单线条画出的刻板轮廓,而活生生的动物有颜色、肌理、动作和光线。从不同的角度看,会呈现出不同形状。

人类非常擅长完成这种任务。只需少量样本,我们能非常轻松抓住一件事物最重要的特征,并把这些特征应用到不熟悉的样例中。另一方面,计算机通常需要浏览一个完整的长颈鹿(处在许多背景中、不同角度观察到的长颈鹿)数据库,从而学习正确的识别这种生物。

视觉识别,是众多人类强于计算机的领域之一。从数据洪流中寻找关联信息、解决非结构的难题、无监督学习(比如,小孩玩积木时学习重力知识)这些领域也是我们更加擅长的。「人类是好得多的通才」卡耐基梅隆大学的计算机科学和神经科学专家Tai Sing Lee说,「我们的思考更加灵活,并能预测、想象甚至创造未来的事件。」

联邦政府情报部门资助了一个非常有野心的新项目,旨在让人工智能更加符合我们自己的脑力力量(metal powers)。由神经学专家和计算机科学专家组成的三支队伍将试图搞清楚大脑是如何完成这些视觉识别壮举,然后让机器也能完成这样的任务。牵头IARPA(Intelligence Advanced Research Projects Activity)项目的Jacob Vogelstein说,「如今的机器学习在人类擅长的领域是失败的。我们想要通过对大脑算法和计算方式的逆向工程研究,彻底改变机器学习。」

时间短。现在,每一团队正从史无前例的细节上,为一块皮质建模。与此同时,团队正在研发算法,部分基于他们所学的内容。到明年夏季,这些算法中的每一个都会被展示一个陌生事物的实例,然后要求算法从未标记数据库中数以千计的图片中,选出这一实例的例子。西雅图艾伦脑科学研究所主席兼首席科学家Christof Kocha也正在与其中一个团队合作,他说,「时间很紧迫。」

Koch 和他的同事现在正在给一小块大脑——一百万立方微米,总计是罂粟种子体积的 五百分之一——创建完整的连接图(wiring diagram)。去年六月发表的成果给出了当时最广阔的完整连接图,大约花了六年时间才完整,如今正在绘制中的线路图规模更大。

在为期五年的 IARPA 项目——被称为来自大脑皮层网络的机器智能(Machine Intelligence from Cortical Networks (http://www.iarpa.gov/index.php/research-programs/microns),MICrONS)——结束之前,研究员们旨在绘制出一立方毫米大脑皮层。这一极小部分拥有大约 100,000 个神经元,300万到 1500万神经元连接,或者说是突触, 如果将神经线路全部解开,然后首位相连的话,神经连接曼哈顿的之宽足以媲美曼哈顿的宽度。

没有人尝试过以这样的规模重建一部分大脑组织。但是,规模更小一些的努力已经表明,这些绘制图能为我们提供关于皮质内部运作的洞见。在一篇发表在三月《 Nature 》上的论文中,与 Koch 的团队合作的哈佛大学神经科学专家 Wei-Chung Allen Lee 与其合作者共同绘制出了 一张50 个神经元以及1000多个神经元伙伴的连接图。将这份连接图与大脑中每个神经元如何工作的信息——比如,有些对竖线输入作出回应——进行比较,他们推导了出皮层该部分神经元解剖学连接的简单规则。他们发现,有相似功能的神经元更易于连接,而且彼此连接的规模大于与其他类型神经元的连接。

尽管 MICrONS 的暗含目标是技术性的——除了其他方面,IARPA 资助那些最终有可能为智能社区带来数据分析工具的研究——但是,对大脑的新而深刻的理解将必须放在第一位。贝勒医学院神经学家 Andreas Tolias 是 Koch 的团队的共同领导,他将我们目前对皮质的知识比作是一张模糊的照片。他希望 MICrONS 计划的空前规模将帮助我们让「这张照片」更清晰,揭示出管理我们神经回路的更复杂的规则。他说,如果不了解所有的组成部分,「也许我们就错失了这种结构的美。」

大脑的处理单元

大脑表面覆盖的复杂褶皱形成了大脑皮质,一片披萨大小的组织揉成一团以适应我们的头骨大小。它在很多方面都是大脑的微处理器。这片大约厚 3 毫米的组织是由一系列的重复模块构成的,这些模块类似于微电路,即计算机芯片中的逻辑门阵列。每一个模块都由大约 100,000 个神经元排列成复杂的互联细胞网络构成。证据表明,在整个皮质中,这些模块的基本结构是大致相同的。但是,大脑不同区域的模块有各自不同的特定目的,如视觉、运动或听觉。

重磅 | 揭秘IARPA项目:解码大脑算法或将彻底改变机器学习1

领导一支 MICrONS 团队的 Andreas Tolias(左)与他的学生 R.J. Cotton。

科学家对这些模块的样子和工作方式只有一个大概的认识。要在数十或数百个神经元的更小的尺度上研究大脑,他们受到了很大的限制。而为追踪数千个神经元的形状、行为和连接而设计的新技术终于让研究者可以分析模块内的细胞彼此交互的方式;系统中一个部分的活动可能会怎样引发或抑制另一部分的活动。「有史以来第一次,我们有能力审查这些模块,而不只是猜测其中的内容。」Vogelstein 说,「对于其内部有什么,不同的团队有不同的猜测。」

这些研究者的重点是皮质中处理视觉的部分,这是神经科学家已经集中探索过的和计算机科学家长时间来一直在努力模仿的一个感官系统。「视觉似乎很容易——只是睁开眼睛而已——但教会计算机做同样的事情却很艰难。」哈佛大学神经科学家 David Cox 说,他也领导着一支 IARPA 研究团队。

每一个团队以有关视觉工作方式的相同基本观念作为开始,一个已有几十年历史的被称为分析-综合(analysis-by-synthesis)的理论。按照这个思路,大脑做出关于不久的将来即将发生的事情的预测,然后将这些预测和其所见到的内容进行调和。这一方法的力量在于它的效率——它所需的计算比随时间连续重建每一时刻所需的计算更少。

大脑可能以任何数量的不同方式执行这种分析,所以,每一个团队都在探索不同的可能。Cox 的团队将大脑看作是某种物理引擎,带有已经存在的用于模拟世界应该具有的模样的物理模型。Tai Sing Lee 与 George Church 联合领导的团队的理论是大脑会构建一个组件库——物体和人的零碎信息——并且学习如何将这些组件组合到一起的规则。例如,树叶往往出现在树枝上。Tolias 的研究组研究的是一种更为数据驱动的方法,其中大脑为其所生活的世界创建统计预期。他的团队将为回路中不同组分学习交流的方式测试各种假说。  

这三个研究团队都将监测目标大脑块中数万个神经元的活动。然后,他们会使用不同方法创建这些细胞的连接图。例如, Cox 的团队会将大脑组织切割成比头发丝还薄的切片,然后使用电子显微镜分析每一片切片。之后该团队会通过计算方式将每一个截面缝合到一起,创建一个密密麻麻的包含数百万个穿过皮质的复杂路径的神经线路的三维图。

有了大脑线路图和活动模式之后,每一个团队都将尝试梳理出一些支配大脑回路的基本规则。然后他们会将这些规则编程为一个仿真模型,并检测该仿真模型和真实大脑的匹配程度。

Tolias 及其合作者已经领略到一些这类方法可以实现的成果。在去年 11 月发表于 Science 的一篇论文中,他们得到了 11,000 个神经元对之间的连接图,并在这一过程中揭示了五种新类型的神经元。「我们仍然没有构成皮质的组分的完整清单,也不知道这些单独的细胞看起来什么样、它们是什么连接的。」Koch 说,「那就是(Tolias)已经在开始做的事情。」

重磅 | 揭秘IARPA项目:解码大脑算法或将彻底改变机器学习2

Andreas Tolias和合作者绘制出了成对神经元中的连接并记录下它们的放电活动。五个神经元(上部靠左)的复杂解剖可以被归结为一个简单的回路图标(上部靠右)。将电流注入神经元2,能让神经元放电,引发两个下游的细胞发生电子变化,即神经元1 和 5(底部)。

在数以千计的神经连接中,Tolia 的团队揭开了三条支配细胞如何连接的普遍规则:一些神经元主要与他们自己同类神经元交流;另一些避开自己的同类,主要与其他类别的神经元对话;第三组只与特定少数神经元对话。(Tolia 的团队是基于神经解剖学而不是功能来定义细胞,Wei Lee 的团队则用功能来定义细胞。)运用这三条连接规则,研究员们能相当准确地模拟神经回路。「现在的挑战是解决这些连接规则在算法上意味着什么。」Tolia 说,「它们是如何计算的?」

基于真实神经元的神经网络

类脑人工智能不是新鲜观点。所谓的神经网络,也就是模仿大脑基本结构,在二十世纪八十年代红极一时。但是那时,这一领域缺乏计算能力和训练数据,而这是算法变得真正有效所需要的。毕竟,当时网上所有标记为猫的数百万图片无法得以有效利用。尽管神经网络已经享受到伟大复兴——基于神经网络算法的语音和面孔识别程序已快速成为我们日常生活的一部分,而且 AlphaGo 最近打败了世界顶级围棋选手——但是,人工神经网络用于更改它们连接的规则,几乎肯定不同于大脑采用的规则。

当代神经网络「是基于我们在上世纪六十 年代掌握的脑知识。」这是 Terry Sejnowski 的原话。他是圣地亚哥索尔克研究所的计算神经科学家,和多伦多大学计算机科学家Geoffrey Hinton 共同开发了早期神经网络算法。「有关大脑如何组织的知识正在爆炸式增长。」

例如,如今的神经网络包含一个前馈结构,在这里信息通过一系列层级从输入流向输出。每一层被训练用来识别某种特征,比如,眼睛或胡须。然后,分析结果向前输送,接下来的每一层对数据进行更加复杂的计算。,电脑程序就是用这样的办法最终将一系列彩色像素识别为猫。

但是,这种前馈结构漏掉了生物系统中的关键组成部分:反馈,既有单层内的反馈,又有从高级层向低级层的反馈。在真正的大脑里,一层皮质里神经元不仅与它们的邻近相连,也与位于其上、下层的神经元相连,创建出错综复杂的网络环路。「反馈连接是皮层网络机器极其重要的一部分。」 Sejnowski 说,「反馈和前馈连接一样多。」

神经科学家尚未精确理解反馈回路在做什么,虽然他们知道,在我们指挥注意力的能力方面,这些反馈回路很重要。例如,它们帮助我们听到手机上的声音,与此同时隔绝让我们分心的城市噪音。分析-综合理论的部分吸引力在于,为所有反复出现的连接(recurrent connections)提供了理由。它们帮助大脑比较预期与现实。

Microns 研究员打算破解管理反馈环路的规则——比如,这些环路连接了哪些细胞,什么激发了它们的活动,这些活动又是如何影响环路输出的——然后将这些规则翻译成算法。Tai Sing Lee 说,「现在,机器缺乏的是想象力和内省。我相信,反馈回路能让我们进行许多不同层次的想象和反省的。」

也许,反馈回路将某天赋予机器一些(我们认为)人类独有的特质。「如果你在一个深度网络中使用『反馈回路』,你就能从一种具有有某种下意识反应——给出输入,获取输出——的神经网络,发展到一种更加灵活的网络,它能开始思考输入并测试假设,」Sejnowski说,目前他担任奥巴马总统1亿美元BRAIN Initiative的顾问,Microns项目也是这个计划的一部分。

通向意识的线索

就像所有的IARPA项目,Microns的项目风险高。研究人员大规模绘制神经元活动和线路需要技术,目前也存在这样的技术,但是,之前没有人以这种规模运用过这些技术。研究人员面临的挑战之一就是如何处理研究产生的海量数据量——大脑每立方毫米就有1到2拍字节。团队可能需要开发出新的机器学习工具,分析所有数据,一个相当具有讽刺意味的它自己的反馈环路。

从一小块大脑学到的东西是否将证明是 大脑更大天赋的例证,也不清楚。Sejnowski说,「大脑并不仅仅是一片皮质,」「大脑是数以百计专司各种不同功能系统(的集合。)」

大脑皮质本身由大致相同的重复着的单元组成。但是,大脑的另一部分可能扮演完全不同的功能。比如,Alpha Go算法采用的加强学习就与基底神经节(basal ganglia)——与成瘾有关的大脑部分——活动过程有关。「如果你希望人工智能超越简单的模式识别,需要很多不同的功能部分,」Sejnowksi说。

然而,项目要成功,就不能止于分析智能数据。一个成功的算法将揭开大脑如何理解世界这一重要真相。特别是,它会有助于确认大脑的确是通过分析—综合运行的——它会将自己对世界的预测与通过我们感官输入的数据进行比较。它将揭示出,意识的关键成分是永远变化着的想象与感知的混合物 。「它是一种想象,允许我们预测未来发生的事情,并使用这一预测指导我们的行动,」Tai Sing Lee说。通过打造思考机器,这些研究人员希望揭开思维自身之谜。


原文发布时间: 2016-04-08 20:49
本文作者: Emily Singer
本文来自云栖社区合作伙伴镁客网,了解相关信息可以关注镁客网。
相关文章
|
25天前
|
机器学习/深度学习 人工智能 前端开发
机器学习PAI常见问题之web ui 项目启动后页面打不开如何解决
PAI(平台为智能,Platform for Artificial Intelligence)是阿里云提供的一个全面的人工智能开发平台,旨在为开发者提供机器学习、深度学习等人工智能技术的模型训练、优化和部署服务。以下是PAI平台使用中的一些常见问题及其答案汇总,帮助用户解决在使用过程中遇到的问题。
|
25天前
|
机器学习/深度学习 数据采集 监控
大模型开发:描述一个典型的机器学习项目流程。
机器学习项目涉及问题定义、数据收集、预处理、特征工程、模型选择、训练、评估、优化、部署和监控。每个阶段都是确保模型有效可靠的关键,需要细致操作。
17 0
|
16天前
|
机器学习/深度学习 算法 搜索推荐
Machine Learning机器学习之决策树算法 Decision Tree(附Python代码)
Machine Learning机器学习之决策树算法 Decision Tree(附Python代码)
|
8天前
|
机器学习/深度学习 自然语言处理 算法
|
24天前
|
机器学习/深度学习 分布式计算 算法
大模型开发:你如何确定使用哪种机器学习算法?
在大型机器学习模型开发中,选择算法是关键。首先,明确问题类型(如回归、分类、聚类等)。其次,考虑数据规模、特征数量和类型、分布和结构,以判断适合的算法。再者,评估性能要求(准确性、速度、可解释性)和资源限制(计算资源、内存)。同时,利用领域知识和正则化来选择模型。最后,通过实验验证和模型比较进行优化。此过程涉及迭代和业务需求的技术权衡。
|
29天前
|
机器学习/深度学习 数据采集 算法
构建高效机器学习模型:从数据处理到算法优化
【2月更文挑战第30天】 在数据驱动的时代,构建一个高效的机器学习模型是实现智能决策和预测的关键。本文将深入探讨如何通过有效的数据处理策略、合理的特征工程、选择适宜的学习算法以及进行细致的参数调优来提升模型性能。我们将剖析标准化与归一化的差异,探索主成分分析(PCA)的降维魔力,讨论支持向量机(SVM)和随机森林等算法的适用场景,并最终通过网格搜索(GridSearchCV)来实现参数的最优化。本文旨在为读者提供一条清晰的路径,以应对机器学习项目中的挑战,从而在实际应用中取得更精准的预测结果和更强的泛化能力。
|
1月前
|
算法 搜索推荐 Java
利用java编写的项目设备调配系统代码示例(内含5种设备调配的算法)
利用java编写的项目设备调配系统代码示例(内含5种设备调配的算法)
13 1
|
1月前
|
机器学习/深度学习 自然语言处理 算法
【机器学习】包裹式特征选择之拉斯维加斯包装器(LVW)算法
【机器学习】包裹式特征选择之拉斯维加斯包装器(LVW)算法
50 0
|
1月前
|
机器学习/深度学习 存储 算法
【机器学习】包裹式特征选择之基于遗传算法的特征选择
【机器学习】包裹式特征选择之基于遗传算法的特征选择
48 0
|
1月前
|
机器学习/深度学习 存储 搜索推荐
利用机器学习算法改善电商推荐系统的效率
电商行业日益竞争激烈,提升用户体验成为关键。本文将探讨如何利用机器学习算法优化电商推荐系统,通过分析用户行为数据和商品信息,实现个性化推荐,从而提高推荐效率和准确性。

热门文章

最新文章