73年前,香农已经给大模型发展埋下一颗种子

简介: 【7月更文挑战第13天】克劳德·香农1951年的论文《印刷英语的预测和熵》预示了大模型的未来。他探索了语言统计特性在预测下一个字母出现中的作用,开创性地计算了语言熵,为信息传输效率提供了评估手段。香农的工作虽限于英语和单个字母预测,但其思想为现代大模型的训练、评估和应用奠定了基础。[🔗](https://www.princeton.edu/~wbialek/rome/refs/shannon_51.pdf)**

在信息论的历史上,有一位被誉为“信息论之父”的科学家,他就是克劳德·香农(Claude Shannon)。他在1948年发表了一篇名为《通信的数学理论》的论文,这篇论文被认为是信息论的奠基之作。然而,鲜为人知的是,早在1951年,香农就为大模型的发展埋下了一颗种子。

这篇名为《印刷英语的预测和熵》的论文,主要研究了如何利用语言的统计特性来预测下一个字母的出现。虽然这篇论文并没有直接涉及大模型的概念,但它为大模型的发展提供了重要的理论基础。

首先,让我们来看看香农的研究背景。在20世纪40年代,香农在贝尔实验室工作期间,对通信系统产生了浓厚的兴趣。他意识到,要提高通信系统的效率,关键在于如何有效地传输和存储信息。于是,他开始研究如何用数学方法来描述信息的传输和存储过程。

在《印刷英语的预测和熵》这篇论文中,香农提出了一种基于语言统计特性的预测方法。他发现,人们在阅读文本时,可以根据前面的字母来预测下一个字母的出现。这种预测能力源于人们对语言的统计特性的了解,例如字母的频率、字母组合的出现概率等。

香农通过实验研究了英语的预测能力。他让被试者猜测一段文本中的下一个字母,并记录下他们的猜测结果。根据实验结果,香农发现,人们在猜测下一个字母时,通常只需要知道前面几个字母的信息。这表明,英语的预测能力是有限的,但仍然可以利用语言的统计特性来进行预测。

基于这些实验结果,香农提出了一种计算语言熵的方法。语言的熵可以看作是语言的不确定性或随机性的度量。香农认为,如果我们能够根据前面的字母来预测下一个字母的出现,那么语言的熵就会降低。因此,他提出了一种基于预测的熵计算方法,这种方法可以用于评估语言的预测能力和信息传输效率。

然而,香农的研究也存在一些局限性。首先,他的研究主要关注的是英语的预测能力,而没有考虑其他语言的特点。其次,他的研究主要基于实验数据,而没有进行更深入的数学分析。最后,他的研究主要关注的是单个字母的预测,而没有考虑更复杂的语言结构,如单词、短语等。

尽管如此,香农的研究仍然为大模型的发展提供了重要的启示。首先,他强调了语言的统计特性在预测中的重要性,这为大模型的训练提供了思路。大模型可以通过学习语言的统计特性来进行预测,从而提高预测的准确性。

其次,香农的研究为大模型的评估提供了方法。通过计算语言的熵,我们可以评估大模型的预测能力和信息传输效率。这为我们选择合适的大模型提供了依据。

最后,香农的研究为大模型的应用提供了方向。虽然他的研究主要关注的是单个字母的预测,但我们可以将这种预测能力应用到更复杂的语言结构上。例如,我们可以利用大模型来预测下一个单词的出现,或者生成连贯的文本。

论文链接:https://www.princeton.edu/~wbialek/rome/refs/shannon_51.pdf

目录
相关文章
|
4月前
|
算法 C++
【c/c++算法】曼哈顿算法简单运用
【c/c++算法】曼哈顿算法简单运用
基于蒙特卡洛随机潮流研究(Matlab代码实现)
基于蒙特卡洛随机潮流研究(Matlab代码实现)
|
决策智能
博弈论第十一集总结(进化稳定—合作,突变,与平衡 “ 观后感)
博弈论第十一集总结(进化稳定—合作,突变,与平衡 “ 观后感)
68 0
|
机器学习/深度学习 存储 人工智能
超高效人工光电神经元成真?速度比自然神经元快3万倍,研究登Nature子刊
超高效人工光电神经元成真?速度比自然神经元快3万倍,研究登Nature子刊
超高效人工光电神经元成真?速度比自然神经元快3万倍,研究登Nature子刊
数学家证明30年前的「安德烈-奥尔特猜想」,推进多项式方程解探索
数学家解决了一个重要问题,即多项式方程的解如何与称为志村变体的复杂几何对象相关联。
174 0
数学家证明30年前的「安德烈-奥尔特猜想」,推进多项式方程解探索
|
量子技术
100多位作者联手!谷歌用量子计算机造出「时间晶体」,挑战热力学第二定律
近日,谷歌联合几十位物理学家,用量子计算机造出了「时间晶体」。
171 0
100多位作者联手!谷歌用量子计算机造出「时间晶体」,挑战热力学第二定律
|
机器学习/深度学习 人工智能 算法
量子霸权终实现?谷歌3分20秒完成世界第一超算万年运算
这或许是计算机领域的一个里程碑事件:谷歌宣称「量子霸权」已经实现,他们首次在实验中证明了量子计算机对于传统架构计算机的优越性:在世界第一超算 Summit 需要计算 1 万年的实验中,谷歌的量子计算机只用了 3 分 20 秒。
122 0
量子霸权终实现?谷歌3分20秒完成世界第一超算万年运算
“平行宇宙”要证实?科学家打造出预测多个“未来”的量子计算机
该计算机在亚原子尺度上运行,最多能够同时模拟16条光子位置的时间线,也就是说该设备目前能够模拟16种未来。
411 0
历时30年探索牛顿之谜,中国科学家测出迄今最高精度万有引力常数值!
北京时间8月30日凌晨,Nature刊发了中科院院士罗俊团队历经30年最新测定的万有引力常数G值的结果,是迄今国际上最高精度的G值。实验使用了两种单独的G值测量方法,相关装置和细节均由团队自主研制完成,Nature刊文评论称,这项实验可谓“精确测量领域卓越工艺的典范”。
1988 0
下一篇
无影云桌面