发表Nature封面论文「大脑语义地图」之后的研究进展

简介: 加州伯克利大学的 Jack Gallant 和他的团队(Gallant 认知、计算和系统神经科学实验室)终于成功绘制出大脑语义地图(985 个英语常用词汇语义)。

2016年4月的《Nature》封面文章《Semantic information in natural narrative speech is represented in complex maps that tile human cerebral cortex》中,加州伯克利大学的  Jack Gallant 和他的团队(Gallant 认知、计算和系统神经科学实验室)终于成功绘制出大脑语义地图(985 个英语常用词汇语义)。我们可以清楚看到大脑如何根据更深一层的词汇含义,将词汇安置到诸如数字、地点或其他基于共通主题的子类别当中。

image.gif

2016年5月26日(当地时间),脑科学领域的顶级峰会 Brain Forum 2016 在瑞士洛桑的瑞士科技会议中心举行,脑科学领域的世界级专家、研究者、工程师、医疗健康专家、创业企业家、产业专家和投资人集聚一堂,共同探讨如何将脑科学转变成触手可及的解决方案。

微信图片_20211126204541.jpg

机器之心是唯一一家获邀参会报道的中国媒体。会议期间,机器之心记者赵云峰专程采访了也来参加这次峰会的 Jack Gallant 教授。

微信图片_20211126204600.jpg

采访开始


机器之心:在发表了论文《Semantic information in natural narrative speech is represented in complex maps that tile human cerebral cortex》之后,您的团队开始探索新的地图(atlas),大脑如何保存语言其他方面的信息,比如句法(syntax),目前在这些方面上有什么新进展?

微信图片_20211126204618.jpg

Jack Gallant:用 Moth 的故事( The Moth Radio Hour,也就是 Nature 封面研究中使用的故事——编辑)做完上次研究后,我们给所有其他水平的信号进行了建模,包括音素(phonemes)、词素(morphemes)、句法(syntax)、语义等。我们没有做叙述,因为给叙述建模过于争议,目前还没有统一标准。


语义目前是探讨的最广泛的话题,最容易发表这方面的文章,所以我们将这方面的论文发表了。这周我们还会发出另一篇论文,主要关于句法、音素等。结果要几个月后。这项研究和之前的研究是一回事,只不过针对的是不同信号特征。


处理这些对象的难点在于,它们发生时间都是很短的,而功能性磁共振成像更善于记录发生速度慢的信息,对于快速发生的事件效果很差。因此,尽管我们能够选择其它特征来进行建模,但是它们并不都是效果最好的。


机器之心:你们绘制完成的地图,让我们看到大脑不同区域如何表征 958 个常见英语词汇意义...


Jack Gallant:  我们选取了英文中最常用的 985 个单词,并尝试在一个含有 60 亿单词之多的语料库中,寻找它们之间的关系。这个过程与语义分析很像,是一个共向变量空间。    所以这些特性是词义上(meaning)的特性,它更像是词义连成的关系网,其中每一个词义都能够通过其与附近词义的关系推导得出。


机器之心:下一个研究目标是什么?


Jack Gallant:我们近期快要完成的是一项比较听力与阅读过程的实验,例如,同样一个故事,你可以通过阅读文字和图片的形式了解,也可以通过听音频的方式。但是,二者的语义地图几乎是一样的。另一个我们感兴趣的主题是双语现象(bilingualism)。拿汉语和英语举例,我们的语义空间是一样的吗?我们的语言空间自然是完全不同的,所以我对汉语的语义一无所知。在双语研究上,最有趣的组合可能是汉语与任意一种欧洲语言,因为它们在语言学中属于两种完全不同的分支,许多意群的发展形式也是完全不同的。目前我们主要重心在英语和汉语上,未来也可能比较英语和西班牙语,等等。


机器之心:你认为你们的研究成果会给人工智能领域一些灵感,让机器学习表现更好吗?


Jack Gallant:谷歌翻译很赞!在实验室我们大量地使用人工智能应用,如获得事物特征等。我们会将自然语言处理应用到故事上。例如,当你玩电脑游戏的时候,游戏中的所有你能看见的、你的目标等等信息,都一定能够在你的大脑中被表现,但是我们怎样才能知道这些特征是什么?


有一种你能想象的方法是,我们干脆让一个人工智能来玩这个游戏,然后让其内部显现的特征带入到大脑中。因此,我同时也感到,因为我们对大脑的认知如此有限,所以其实很多时候我们是将人工智能上的信息应用到大脑上,而不是将大脑上的内容转移到人工智能上。


另外,有一点我认为值得讨论的是,近期大热的神经网络其实也只是受人类大脑的启发而已,而并非高度的模仿。因为在大脑中的神经网络里,信息是双向流动的,前馈与反馈是并存的,如果你完全关闭了反馈的通道,整个系统就会崩溃。然而在计算机领域的神经网络中,信息是单向流动的,也就是只有正馈。因此,我相信,这种含有正反馈的动态的神经回路机制会在计算机领域变得十分重要。


机器之心:你的研究很棒,看起来就像一个平台,未来这个平台会向其他人,比如科学家、研究人员开放吗?


Jack Gallant:会的。我们希望人们了解我们在做什么。SPM 是一种进行功能制图的传统工具,在使用 SPM 的时候,你必须先获得平滑数据。但是将数据平滑化的原因不是因为这样对数据好,而是因为这样使得统计参数图在统计意义上更具有合理性。这种做法事实上对研究是有害的,因为在这一过程中,为了使统计方法运作良好,你事实上丢失了很多信息。而在我们的框架中,你不需要平滑数据,除非你必须这么做。我们希望更多人能有机会使用这一平台,但我们可能不会自己提供软件上的支持。目前,我们会一点点地开放。但是像 Brain Viewer 这样的工具已经是完全开放的了,任何人都可以在上面对大脑结构进行剖析和观察。你可以直接到 GitHub 下载。


在学校内部,我们也将我们的软件开放给伯克利的情绪研究室的研究人员们,他们能够使用我们的软件和系统完成自己的实验。此外,我们也正在和加州理工的实验室进行合作。


机器之心:您这项研究的最终目标是什么?您希望能在多大程度上了解大脑理解语言的方式?


Jack Gallant:语言只是作为人类的一个组成部分,当我们在做功能性磁共振成像语言实验的时候,我们不是在理解语言,而是试图理解大脑是如何理解语言的。我认为这二者是不同的,所以我更关注的是研究大脑是如何理解语言的。所以我们努力在做的唯一一件事情是,将大脑所有区域中的所有信息还原出来。假设有 500 个在运作的大脑区域,其中每一个区域代表 15 个维度(dimensions),那么现在我们就很清楚有 7,500 个维度是我们需要还原的,那么我们就有了大脑中全部 7,500 个维度的信息。而这些只是名义上在不同大脑空间中被转译的信息,其中还有很多子空间,我们现在在座的就是尽可能多地将这些信息还原。


机器之心:假如我们完全了解了大脑对语言的理解机制,未来我们是否有可能实现无需对话,而直接在人脑间进行交流?


Jack Gallant:这个问题很有意思,我想这最终是可能会发生的。但是,现在我们还有很长的路要走。可能很多人小的时候都有这样的经历:你将收音机拆开试图了解它的工作原理,然后你发现其中一个回路是调节音量大小的——可能电压越大音量越大。下一次,当你觉得音量太小的时候,你会尝试增加电压,而这可能导致整个收音机直接报废了。理解一样东西总是比修改一样东西要容易得多,大脑也是这样。即使我们能够很好地掌握大脑理解语言的机制,但如果真要实现大脑间直接的交流,我们需要在大脑中植入外部工具,甚至是改变大脑的结构,而一点点细微的差错或噪音就可能产生难以预料的后果,所以我想实现这一点,我们还需要很长一段时间。


采访结束


Jack Gallant:你竟然穿着我们死对头(斯坦福)的T恤采访我。(玩笑)


机器之心:Go bears!

相关文章
|
11月前
|
关系型数据库 MySQL Java
【IDEA】java后台操作mysql数据库驱动常见错误解决方案
【IDEA】java后台操作mysql数据库驱动常见错误解决方案
299 0
|
缓存 Java 应用服务中间件
线程池的10个坑你都遇到过吗
日常开发中,为了更好管理线程资源,减少创建线程和销毁线程的资源损耗,我们会使用线程池来执行一些异步任务。但是线程池使用不当,就可能会引发生产事故。大家看完肯定会有帮助的~
367 0
|
JSON 自然语言处理 安全
百度工程师厂外生存指南
百度曾经一度被称为中国互联网的黄埔军校。这句话其实有两方面含义:一是说从百度走出来的工程师活跃在中国各大互联网企业中,对整个中国互联网的繁荣发展做出了贡献。二是说百度如同历史上的黄埔军校一般,为外界培育和输送了大量人才,但是自身却在逐步没落,暗示百度的人才流失严重。然而很多百度厂内高管常以『百度是中国互联网的黄埔军校』而自豪,这只是理解了这句话的第一层含义,却殊不知其第二层。高管们不对厂内人才大量流失的原因做反思,反而因为一句黄埔军校而沾沾自喜。着实让人唏嘘不已。
1308 1
百度工程师厂外生存指南
|
存储 前端开发 算法
激光SLAM:ALOAM---后端lasermapping地图栅格化处理与提取
不同于前端的scan-to-scan的过程,ALOAM的后端是scan-to-map的算法,具体来说就是把当前帧和地图进行匹配,得到更准确的位姿同时也可以构建更好的地图.由于是scan-to-map的算法,因此计算量会明显高于scan-to-scan的前端,所以后端通常处于一个低频的运行频率,但是由于scan-to-map的精度往往优于scan-to-scan.因此后端也有比前端更高的精度.为了提高后端的处理速度,所以要进行地图的栅格化处理
激光SLAM:ALOAM---后端lasermapping地图栅格化处理与提取
|
2月前
|
数据采集 存储 BI
数据中台是什么?一文讲清为什么要建设数据中台
数据中台是企业实现数据整合与高效应用的关键平台,能够打通数据孤岛、提升决策效率并降低成本。它通过统一管理、清洗和分发数据,支撑业务创新与实时分析,是企业在数字化转型中的核心基础设施。
|
7月前
|
机器学习/深度学习 存储 API
DeepSeek强化学习(Reinforcement Learning)基础与实践
强化学习(RL)是机器学习的重要分支,专注于训练智能体在环境中通过试错学习最优策略。DeepSeek提供了强大的工具和API,帮助高效构建和训练RL模型。本文将详细介绍使用DeepSeek进行强化学习的基础与实践,涵盖环境构建、智能体定义、Q学习及DQN训练等内容,并提供代码示例,助你掌握这些技巧。
|
12月前
|
机器学习/深度学习 人工智能 搜索推荐
AI与未来医疗:革命性的技术,重塑健康格局
本文探讨了人工智能(AI)在医疗领域的应用及其对未来健康的深远影响。通过分析AI在疾病诊断、治疗和预防方面的具体案例,揭示了这一技术如何提升医疗服务的效率和准确性,并展望了AI在未来医疗中的潜力。
264 28
|
8月前
|
存储 监控 自动驾驶
云端问道15期方案教学-基于数据生命周期管理的存储成本优化
基于数据生命周期管理的存储成本优化,由王太平分享。内容涵盖对象存储的产品技术背景、介绍、核心功能及商业应用情况。重点讲解了如何通过生命周期管理,根据数据热度和访问时间,将数据智能迁移至不同存储层级(标准、低频、归档、冷归档、深度冷归档),从而实现成本最优。同时,针对不同类型的数据访问需求,提供了具体的策略建议,帮助企业在不影响业务的前提下大幅降低存储成本。
199 0
|
11月前
|
监控 JavaScript
Vuex学习二:Vuex的重点属性学习,state、mutations、getters、actions、module。
这篇文章是关于Vuex状态管理库的深入学习,涵盖了其核心概念如state、getters、mutations、actions和modules,并通过实例代码展示了它们的使用和重要性。
160 1
|
城市大脑 人工智能 监控
如何谋求新的业务机会点?回归市场,探寻数字化新解
如何谋求新的业务机会点?回归市场,探寻数字化新解
331 0

热门文章

最新文章