神经网络中的遗忘,遗忘的作用

简介: 神经网络中的遗忘,遗忘的作用

遗忘是为了对抗过拟合



两种遗忘方式的对比

 

查找记忆的删除是一条一条的删,而网络记忆的删除是断开连接。


学习中的遗忘

   

学习的过程是寻找符合所有情况的规律的过程

   

在这个过程中,有时候我们的大脑会断开连接,有时候又会重塑连接

假设猜想:如果我们的大脑不会断开连接,那么我们便会,只知道解决学习时已见过的情况,而不会解决未见过的情况。这样的“学习”只能是记忆,记忆所有信息,却不能找到共同的规律。(网络的过拟合)


案例验证:比如现实生活中的雨人,他看完了一本书记住了里面的所有内容,但他日常生活能力低下,四岁才会走路,现在都还不会系扣子,智力测试也只有87分。


学习后的遗忘

   

为什么已经被记住的内容还是会遗忘?


生存困难: 寻找到普遍性的规律的生物,有大概率能存活,而只寻找到局部规律的生物,存活的概率变便很小。

   

演化结果: 所以,大脑演化出一种该规律多次出现就强化该连接,出现次数少便弱化该连接的机制。这并不是为了忘记痛苦的记忆,或者节省能量,而是为了抑制局部规律形成的过拟合。

“ 你忘记所有的招式,就练成太极拳了”


原文: “太极拳只重其义,不重其招。你忘记所有的招式,就练成太极拳了。”


解释: “忘记”并非字面意思,而是意为不要仅记住个别招式,而失去了应对无限情况的能力。这里的招式是“已知”,“情况”是指任何情况,包括已知,也包括未知。由于人脑的长期记忆也不是查找记忆,并不会去记忆每个情况,所以练太极拳的过程并不是记忆的过程,而是学习的过程。让大脑的神经网络从这些有限的招式中泛化出普遍规律,便可自动应对无限情况。


翻译: ”情况无限,招式有限,需泛化有限招式,来应对无限情况。”


总结


学习中的遗忘: 由于寻找规律(学习)的过程中需要不断的断开连接,重塑连接(不断调整权重,构建模型)


学习后的遗忘: 为了提高泛化能力,防止模型的过拟合,根据连接的使用频率,强化或弱化该连接的一种模型筛选机制。


目录
相关文章
|
8月前
|
机器学习/深度学习 自然语言处理 数据处理
大模型开发:描述长短期记忆网络(LSTM)和它们在序列数据上的应用。
LSTM,一种RNN变体,设计用于解决RNN处理长期依赖的难题。其核心在于门控机制(输入、遗忘、输出门)和长期记忆单元(细胞状态),能有效捕捉序列数据的长期依赖,广泛应用于语言模型、机器翻译等领域。然而,LSTM也存在计算复杂度高、解释性差和数据依赖性强等问题,需要通过优化和增强策略来改进。
233 1
|
机器学习/深度学习 算法 索引
LSTM(长短期记忆网络)原理介绍
LSTM算法是一种重要的目前使用最多的时间序列算法,是一种特殊的RNN(Recurrent Neural Network,循环神经网络),能够学习长期的依赖关系。主要是为了解决长序列训练过程中的梯度消失和梯度爆炸问题。简单来说,就是相比普通的RNN,LSTM能够在更长的序列中有更好的表现。
6008 0
LSTM(长短期记忆网络)原理介绍
|
5月前
|
机器学习/深度学习 人工智能 编解码
【神经网络】基于对抗神经网络的图像生成是如何实现的?
对抗神经网络,尤其是生成对抗网络(GAN),在图像生成领域扮演着重要角色。它们通过一个有趣的概念——对抗训练——来实现图像的生成。以下将深入探讨GAN是如何实现基于对抗神经网络的图像生成的
48 3
|
5月前
|
机器学习/深度学习
【机器学习】面试题:LSTM长短期记忆网络的理解?LSTM是怎么解决梯度消失的问题的?还有哪些其它的解决梯度消失或梯度爆炸的方法?
长短时记忆网络(LSTM)的基本概念、解决梯度消失问题的机制,以及介绍了包括梯度裁剪、改变激活函数、残差结构和Batch Normalization在内的其他方法来解决梯度消失或梯度爆炸问题。
204 2
|
5月前
|
机器学习/深度学习 存储 自然语言处理
|
机器学习/深度学习 传感器 算法
分类预测 | MATLAB实现BiLSTM双向长短期记忆神经网络多特征分类预测
分类预测 | MATLAB实现BiLSTM双向长短期记忆神经网络多特征分类预测
|
机器学习/深度学习 传感器 算法
【LSTM分类】基于注意力机制的卷积神经网络结合长短记忆神经网络CNN-LSTM-attention实现数据分类附matlab代码
【LSTM分类】基于注意力机制的卷积神经网络结合长短记忆神经网络CNN-LSTM-attention实现数据分类附matlab代码
|
机器学习/深度学习
回归预测 | MATLAB实现BiLSTM双向长短期记忆神经网络多输入多输出预测
回归预测 | MATLAB实现BiLSTM双向长短期记忆神经网络多输入多输出预测
|
机器学习/深度学习 传感器 数据采集
【LSTM分类】基于长短期记忆网络的数据分类预测附matlab代码
【LSTM分类】基于长短期记忆网络的数据分类预测附matlab代码
|
机器学习/深度学习 传感器 算法
【LSTM分类】基于白鲸算法优化双向长短期记忆神经网络的数据分类预测附matlab代码 BWO-BiLSTM
【LSTM分类】基于白鲸算法优化双向长短期记忆神经网络的数据分类预测附matlab代码 BWO-BiLSTM