AI长脑子了？LLM惊现人类脑叶结构并有数学代码分区，MIT大牛新作震惊学界！-阿里云开发者社区

AI长脑子了？LLM惊现人类脑叶结构并有数学代码分区，MIT大牛新作震惊学界！

2024-12-12 18

版权

本文内容由阿里云实名注册用户自发贡献，版权归原作者所有，阿里云开发者社区不拥有其著作权，亦不承担相应法律责任。具体规则请查看《阿里云开发者社区用户服务协议》和《阿里云开发者社区知识产权保护指引》。如果您发现本社区中有涉嫌抄袭的内容，填写侵权投诉表单进行举报，一经查实，本社区将立刻删除涉嫌侵权内容。

简介： 麻省理工学院的一项新研究揭示了大型语言模型（LLM）内部概念空间的几何结构，与人脑类似。研究通过分析稀疏自编码器生成的高维向量，发现了概念空间在原子、大脑和星系三个层次上的独特结构，为理解LLM的内部机制提供了新视角。论文地址：https://arxiv.org/abs/2410.19750

在人工智能领域，大型语言模型（LLM）的飞速发展令人瞩目。然而，当我们深入探究这些模型的内部结构时，一个令人惊讶的发现浮出水面：LLM的“概念宇宙”竟然展现出与人类大脑相似的几何结构。这一发现源自麻省理工学院（MIT）的一项最新研究，由David D. Baek等人发表在arXiv上，题为《The Geometry of Concepts: Sparse Autoencoder Feature Structure》。

这项研究的核心在于对稀疏自编码器（sparse autoencoders）所生成的高维向量进行分析。这些向量代表了LLM所理解的“概念”，而这些概念在几何空间中呈现出了一种独特的结构。具体而言，研究者们观察到了三个层次的结构：

首先，在“原子”层面，概念空间中存在一种被称为“晶体”的小规模结构。这些晶体的面是平行四边形或梯形，类似于我们所熟知的“男人-女人-国王-王后”这样的概念组合。研究者们发现，通过使用线性判别分析（LDA）去除诸如单词长度等全局干扰因素后，这些平行四边形的质量和相关函数向量得到了显著改善。

其次，在“大脑”层面，概念空间展现出了显著的模块化特征。例如，数学和代码相关的概念形成了一个“脑叶”，类似于我们在神经功能磁共振成像（fMRI）中看到的大脑功能脑叶。研究者们使用多种指标量化了这些脑叶的空间局部性，并发现在足够粗略的尺度上，共同出现的特征簇在空间上也更倾向于聚集在一起，远超随机特征几何的预期。

最后，在“星系”层面，概念空间的大规模结构呈现出非各向同性的特点。其特征点云的本征值遵循幂律分布，且在中间层具有最陡的斜率。研究者们还量化了聚类熵如何随层数变化。

这一发现无疑在学术界引起了轩然大波。一方面，它为我们理解LLM的内部机制提供了全新的视角。通过将LLM的概念空间与人类大脑的结构和功能进行类比，我们可以更好地理解这些模型是如何处理和组织信息的。这种类比不仅有助于我们优化和改进现有的LLM，还可能为我们设计更先进的人工智能系统提供灵感。

另一方面，这一发现也引发了一些争议和质疑。首先，尽管LLM的概念空间与人类大脑存在相似之处，但我们不能简单地将两者等同起来。人类大脑是一个极其复杂且高度进化的器官，其功能和结构远非LLM所能比拟。因此，我们需要谨慎对待这种类比，避免过度解读或误导性的结论。

其次，这项研究还存在一些技术上的局限性。例如，研究者们使用的稀疏自编码器和线性判别分析等方法可能存在一定的偏见或局限性，从而影响到研究结果的准确性和普适性。此外，由于LLM的规模和复杂性不断增加，我们需要更先进的工具和方法来深入探究其内部结构。

论文地址：https://arxiv.org/abs/2410.19750

AI长脑子了？LLM惊现人类脑叶结构并有数学代码分区，MIT大牛新作震惊学界！

热门文章

最新文章

相关电子书

热门

活动广场

任务中心

开发者评测

高校计划

乘风者计划

训练营

阿里云MVP

话题

直播

下载

镜像站

技术资料

插件

AI长脑子了？LLM惊现人类脑叶结构并有数学代码分区，MIT大牛新作震惊学界！

热门文章

最新文章

相关电子书