73年前,香农已经给大模型发展埋下一颗种子

简介: 【7月更文挑战第13天】克劳德·香农1951年的论文《印刷英语的预测和熵》预示了大模型的未来。他探索了语言统计特性在预测下一个字母出现中的作用,开创性地计算了语言熵,为信息传输效率提供了评估手段。香农的工作虽限于英语和单个字母预测,但其思想为现代大模型的训练、评估和应用奠定了基础。[🔗](https://www.princeton.edu/~wbialek/rome/refs/shannon_51.pdf)**

在信息论的历史上,有一位被誉为“信息论之父”的科学家,他就是克劳德·香农(Claude Shannon)。他在1948年发表了一篇名为《通信的数学理论》的论文,这篇论文被认为是信息论的奠基之作。然而,鲜为人知的是,早在1951年,香农就为大模型的发展埋下了一颗种子。

这篇名为《印刷英语的预测和熵》的论文,主要研究了如何利用语言的统计特性来预测下一个字母的出现。虽然这篇论文并没有直接涉及大模型的概念,但它为大模型的发展提供了重要的理论基础。

首先,让我们来看看香农的研究背景。在20世纪40年代,香农在贝尔实验室工作期间,对通信系统产生了浓厚的兴趣。他意识到,要提高通信系统的效率,关键在于如何有效地传输和存储信息。于是,他开始研究如何用数学方法来描述信息的传输和存储过程。

在《印刷英语的预测和熵》这篇论文中,香农提出了一种基于语言统计特性的预测方法。他发现,人们在阅读文本时,可以根据前面的字母来预测下一个字母的出现。这种预测能力源于人们对语言的统计特性的了解,例如字母的频率、字母组合的出现概率等。

香农通过实验研究了英语的预测能力。他让被试者猜测一段文本中的下一个字母,并记录下他们的猜测结果。根据实验结果,香农发现,人们在猜测下一个字母时,通常只需要知道前面几个字母的信息。这表明,英语的预测能力是有限的,但仍然可以利用语言的统计特性来进行预测。

基于这些实验结果,香农提出了一种计算语言熵的方法。语言的熵可以看作是语言的不确定性或随机性的度量。香农认为,如果我们能够根据前面的字母来预测下一个字母的出现,那么语言的熵就会降低。因此,他提出了一种基于预测的熵计算方法,这种方法可以用于评估语言的预测能力和信息传输效率。

然而,香农的研究也存在一些局限性。首先,他的研究主要关注的是英语的预测能力,而没有考虑其他语言的特点。其次,他的研究主要基于实验数据,而没有进行更深入的数学分析。最后,他的研究主要关注的是单个字母的预测,而没有考虑更复杂的语言结构,如单词、短语等。

尽管如此,香农的研究仍然为大模型的发展提供了重要的启示。首先,他强调了语言的统计特性在预测中的重要性,这为大模型的训练提供了思路。大模型可以通过学习语言的统计特性来进行预测,从而提高预测的准确性。

其次,香农的研究为大模型的评估提供了方法。通过计算语言的熵,我们可以评估大模型的预测能力和信息传输效率。这为我们选择合适的大模型提供了依据。

最后,香农的研究为大模型的应用提供了方向。虽然他的研究主要关注的是单个字母的预测,但我们可以将这种预测能力应用到更复杂的语言结构上。例如,我们可以利用大模型来预测下一个单词的出现,或者生成连贯的文本。

论文链接:https://www.princeton.edu/~wbialek/rome/refs/shannon_51.pdf

目录
打赏
0
9
9
2
396
分享
相关文章
蚁群、蜂群的智慧,大模型也可以有,谷歌等机构群体智能研究亮相
蚁群和蜂群以其独特的群体智能行为著称,如分布式决策、自组织性和鲁棒性。这些特性启发了科学家将群体智能原理应用于大模型的构建,以实现更高效、更智能的系统。谷歌等机构已通过模拟这些行为,开发出如“蚁群优化”算法等成果,显著提高了计算效率和系统的鲁棒性。然而,群体智能的应用仍面临通信协调、个体差异性和可解释性等挑战。
97 3
Nature刊登量子计算重大进展:有史以来第一个量子集成电路实现
Nature刊登量子计算重大进展:有史以来第一个量子集成电路实现
137 0
史上首次,强化学习算法控制核聚变登上Nature:DeepMind让人造太阳向前一大步
史上首次,强化学习算法控制核聚变登上Nature:DeepMind让人造太阳向前一大步
236 0
破解60年前谜题!哥本哈根大学研究人员解决「单源最短路径」问题
破解60年前谜题!哥本哈根大学研究人员解决「单源最短路径」问题
141 0
数学家证明30年前的「安德烈-奥尔特猜想」,推进多项式方程解探索
数学家解决了一个重要问题,即多项式方程的解如何与称为志村变体的复杂几何对象相关联。
215 0
数学家证明30年前的「安德烈-奥尔特猜想」,推进多项式方程解探索
把「醉汉游走」引入「三体问题」,以色列学者新思路登上物理学顶刊
把「醉汉游走」引入「三体问题」,以色列学者新思路登上物理学顶刊
221 0
Reddit热议:15岁高中生用神经网络建立生命进化“新宇宙”
一位年仅15岁波兰高中生利用神经网络和遗传算法模拟出了人造生命的繁衍和进食活动,将视频发在了Youtube上。reddit网友纷纷表示鼓励,并表示,过个几百万年,说不定这个网络能够进化出战争和国家!
236 0
Reddit热议:15岁高中生用神经网络建立生命进化“新宇宙”

热门文章

最新文章