Meta AI开启「解剖大脑」计划,深度学习瓶颈从自然语言突破

本文涉及的产品
NLP自然语言处理_高级版,每接口累计50万次
NLP自然语言处理_基础版,每接口每天50万次
NLP 自学习平台,3个模型定制额度 1个月
简介: Meta AI开启「解剖大脑」计划,深度学习瓶颈从自然语言突破

image.png


【新智元导读】深度学习十年来取得辉煌成就,但其计算、学习效率仍比人类的大脑弱很多。为了突破瓶颈,Meta AI宣布开启一项长期研究计划,以自然语言为切口,比较AI模型和大脑的异同。


近几年,随着大规模预训练语言模型的横空出世,让人类终于有了处理、生成、理解自然语言的能力。

 

虽然模型已经在部分NLP任务上超越了人类的性能,但要说AI在学习、理解语言的能力和效率已经超越了人类,还为时过早。

 

拿一个最简单的词「orange」来说,即便是小孩子也能通过几个简单的例子就能掌握这个词既表示「橘子」,也能表示「橙色」,但现代的AI模型往往需要大量的文本、上下文的学习才能达到相同的理解水平。

 

 

Yann LeCun曾表示,AI系统未来的发展是能够像动物和人类一样进行学习和推理。

 

所以除了开发更先进的模型和数据集,也有一大批研究人员在研究人类的大脑以开发一个更强大的AI模型。

 

MetaAI最近宣布了一项长期研究计划,与神经影像中心NeuroSpin (CEA)和INRIA合作,以更好地了解人类的大脑如何处理语言。

 

 

该项目的主要工作是比较AI语言模型和大脑如何响应相同的口语或书面句子,进而将得出的见解和结论用于指导AI模型的开发,使得新模型能够像人类一样高效地处理语音和文本。

 

早在2019年中,研究人员就已发表了一个多模态神经图像数据集,使用深度学习技术来分析人类在单词和句子处理过程中的脑部活动。

 

论文链接:https://www.nature.com/articles/s41597-019-0020-y

 

通过对比大脑和语言模型之间的差异可以发现,与大脑活动最相近的语言模型是那些能从上下文中最好地预测下一个词的模型(例如,once upon a ... ,模型会输出time),和现在的语言模型训练思路相同。基于部分可观察输入的预测是自监督学习(SSL)训练的核心,可能也是理解人类学习语言的关键。

 

研究人员还发现,大脑中的特定区域可以提前很长时间来预测单词和想法,而大多数现代语言模型通常的训练流程只是用来预测下一个单词。解开人类这种超远距离预测能力的秘密,有助于改善现代人工智能语言模型。

 

 

当然,现在的研究还过于表面,对于大脑的功能,我们还有很多不了解的地方,所以研究还需要继续。

 

这次Meta AI与NeuroSpin的合作正在考虑创建一个原始神经成像数据集来扩大这项研究。未来将开放数据集、深度学习模型、代码,以及由此产生的研究论文,以帮助促进人工智能和神经科学界的发现。

 

Meta表示,所有工作的终极目的是让AI在有限的甚至无监督的情况下学习世界,并达到人类的水平。

 

深度学习「解剖」大脑


神经科学家在分析大脑信号时面临着诸多限制,如果不解决,将大脑与人工智能模型进行比较是根本无法实现的。

 

研究神经元活动和大脑成像是一个时间和资源密集型的过程,需要大量的机器来分析神经元活动,而这些活动往往是不透明和嘈杂的。

 

设计语言实验,以控制的方式测量大脑的反应,也需要大量的工作。例如,在经典的语言研究中,句子的复杂性必须匹配,单词的频率或字母数量必须匹配,以便对大脑反应进行有意义的比较。

 

深度学习的兴起,即多层神经网络一起训练和学习能够缓解这些问题。当志愿者阅读或聆听一个故事时,模型能够高亮大脑中在何处以及何时产生了对单词和句子的感知表征。

 

 

深度学习系统需要大量的数据来确保准确性,而功能性磁共振成像(fMRI)研究只能捕捉到一些大脑活动的快照,通常只是来自小规模的样本。

 

为了满足深度学习所需的大规模数据量,MetaAI的团队不仅使用fMRI对公共数据集记录的成千上万的大脑扫描进行建模,还同时使用脑磁图(MEG)进行建模,这种扫描仪每隔一毫秒就会拍摄大脑活动的快照,比一眨眼还快。

 

二者结合起来,这些神经成像设备提供了大量的神经成像数据,以检测大脑中激活发生的位置和顺序。这一点也是也是剖析人类认知的算法的关键 。

 

在一些研究结果中可以发现,大脑被系统地组织在一个层次结构中,与人工智能语言模型惊人地相似。例如,语言学家长期以来一直预测,语言处理的特点是,在词语能够被组合成有意义的句子之前,有一连串的感觉和词汇计算。

 

 

在深度语言模型和大脑之间的比较精确地验证了这种计算顺序。当阅读一个单词时,大脑首先产生的表征与早期视觉皮层中为识别字符而训练的深度卷积网络相似。

 

然后这些大脑的激活沿着视觉层次转化为类似于单词嵌入的词汇表征。

 

最后,分布式皮质网络产生的神经表征与深度语言模型的中间层和最后层相关。

 

深度学习工具使我们有可能以一种全新的方式解读大脑的层次结构。

 

「上下文预测」是关键


在分析了200个志愿者在阅读文本时产生的大脑激活,并系统性地对比了十来个深度语言模型后,可以发现产生的单词表征和大脑最相关的是「从上下文中预测单词」。

 

MIT的一个团队后来也独立地发现这个结论,这些相似的研究也证明了使用自监督学习才是通往人类水平AI的正确道路。

 

 

但发现大脑和语言模型之间的相似性并不足以抓住语言理解的基本原理,生物神经网络和人工神经网络在计算上的区别也是提升现有模型,构建新的智能模型的关键。

 

最近Meta AI的研究有证据证明,大脑中的长范围预测(long-range prediction)对于今天的语言模型来说仍然是一个重大挑战。

 

比如给了一个短语Once upon a ...,大部分语言模型都能够预测出下一个词「time」,而大脑除了一个词之外,还会产生许许多多相关的概念联想,也就是在构建复杂想法、绘图和像人类一样陈述事实等方面仍然面临极大限制。

 

 

为了探索这个问题的解决方法,Meta AI与INRIA一起,将多个语言模型与345个志愿者的大脑反馈进行比较,志愿者通过听一些复杂的陈述,将大脑活动用fMRI记录下来。我们可以用长范围预测来增强现有的模型,并追踪大脑的预测。

 

结果显示,对于特定的大脑区域,比如前额叶(prefrontal)和顶叶(parietal cortices)都能够用来增强语言模型的深度表示来处理长范围预测问题。

 

总的来说,这些结果支撑了一个相当有前景的研究问题:在大脑和AI模型之间量化相似度。这些相似的研究可以帮助我们了解大脑的功能,提供新的见解,神经科学将指引更智能AI模型的研发。

参考资料:

https://ai.facebook.com/blog/studying-the-brain-to-build-ai-that-processes-language-as-people-do/


相关文章
|
22天前
|
机器学习/深度学习 人工智能 安全
探索AI的未来:从机器学习到深度学习
【10月更文挑战第28天】本文将带你走进AI的世界,从机器学习的基本概念到深度学习的复杂应用,我们将一起探索AI的未来。你将了解到AI如何改变我们的生活,以及它在未来可能带来的影响。无论你是AI专家还是初学者,这篇文章都将为你提供新的视角和思考。让我们一起探索AI的奥秘,看看它将如何塑造我们的未来。
60 3
|
24天前
|
机器学习/深度学习 数据采集 人工智能
AI赋能教育:深度学习在个性化学习系统中的应用
【10月更文挑战第26天】随着人工智能的发展,深度学习技术正逐步应用于教育领域,特别是个性化学习系统中。通过分析学生的学习数据,深度学习模型能够精准预测学生的学习表现,并为其推荐合适的学习资源和规划学习路径,从而提供更加高效、有趣和个性化的学习体验。
81 9
|
12天前
|
机器学习/深度学习 自然语言处理 监控
探索深度学习在自然语言处理中的应用与挑战
本文深入分析了深度学习技术在自然语言处理(NLP)领域的应用,并探讨了当前面临的主要挑战。通过案例研究,展示了如何利用神经网络模型解决文本分类、情感分析、机器翻译等任务。同时,文章也指出了数据稀疏性、模型泛化能力以及计算资源消耗等问题,并对未来的发展趋势进行了展望。
|
16天前
|
人工智能 自然语言处理 API
探索AI在自然语言处理中的应用
【10月更文挑战第34天】本文将深入探讨人工智能(AI)在自然语言处理(NLP)领域的应用,包括语音识别、机器翻译和情感分析等方面。我们将通过代码示例展示如何使用Python和相关库进行文本处理和分析,并讨论AI在NLP中的优势和挑战。
|
23天前
|
机器学习/深度学习 人工智能 算法
AI在医疗:深度学习在医学影像诊断中的最新进展
【10月更文挑战第27天】本文探讨了深度学习技术在医学影像诊断中的最新进展,特别是在卷积神经网络(CNN)的应用。文章介绍了深度学习在识别肿瘤、病变等方面的优势,并提供了一个简单的Python代码示例,展示如何准备医学影像数据集。同时强调了数据隐私和伦理的重要性,展望了AI在医疗领域的未来前景。
52 2
|
1月前
|
机器学习/深度学习 人工智能 自然语言处理
深度学习在自然语言处理中的突破与未来趋势####
本文深入探讨了深度学习技术在自然语言处理(NLP)领域的最新进展,重点介绍了其在语言理解、生成及翻译等方面的革新应用。通过对比传统方法的局限性,展示了深度学习如何以其强大的特征提取和学习能力重塑NLP领域。文章还分析了当前面临的挑战,如模型泛化能力、解释性问题及资源消耗等,并展望了未来发展趋势,包括多模态学习、持续学习机制以及更加公平和可解释的AI模型设计。本文旨在为读者提供一个全面而深入的视角,理解深度学习在推动NLP发展的核心作用及其未来的无限可能。 ####
|
24天前
|
安全 搜索推荐 机器学习/深度学习
AI赋能教育:深度学习在个性化学习系统中的应用
【10月更文挑战第26天】在人工智能的推动下,个性化学习系统逐渐成为教育领域的重要趋势。深度学习作为AI的核心技术,在构建个性化学习系统中发挥关键作用。本文探讨了深度学习在个性化推荐系统、智能辅导系统和学习行为分析中的应用,并提供了代码示例,展示了如何使用Keras构建模型预测学生对课程的兴趣。尽管面临数据隐私和模型可解释性等挑战,深度学习仍有望为教育带来更个性化和高效的学习体验。
60 0
|
24天前
|
机器学习/深度学习 数据采集 人工智能
AI在医疗:深度学习在医学影像诊断中的最新进展
【10月更文挑战第26天】近年来,深度学习技术在医学影像诊断中的应用日益广泛,通过训练大量医学影像数据,实现对疾病的准确诊断。例如,卷积神经网络(CNN)已成功用于识别肺癌、乳腺癌等疾病。深度学习不仅提高了诊断准确性,还缩短了诊断时间,提升了患者体验。然而,数据隐私、数据共享和算法透明性等问题仍需解决。未来,AI将在医学影像诊断中发挥更大作用,成为医生的得力助手。
63 0
|
26天前
|
机器学习/深度学习 人工智能 自然语言处理
深度学习在自然语言处理中的突破与未来展望###
本文深入探讨了深度学习技术在自然语言处理(NLP)领域的最新进展,重点分析了其在该领域实现的重大突破及面临的挑战。通过对比传统方法与深度学习模型的差异,阐述了深度学习如何推动NLP领域的边界拓展,并对未来发展趋势进行了展望。 ###
|
1月前
|
机器学习/深度学习 数据采集 人工智能
数据驱动的AI技术:如何通过深度学习提升图像识别精度
【10月更文挑战第18天】 数据驱动的AI技术:如何通过深度学习提升图像识别精度
50 0
下一篇
无影云桌面