学界 | Yoshua Bengio最新修改版论文:迈向生物学上可信的深度学习

简介: 深度学习和人工神经网络已经从大脑获得灵感,但大部分是在计算表现形式上的灵感(大多是生物学的,比如 spike 的存在留待考虑)。然而,如今缺少的是对生物神经元中存在的学习规则的一个可信的机器学习说明,从而能够解释一个深度神经网络有效的联合训练,也就是通过一个神经连接长链说明信任分配(credit assignment)。因此,解决信任分配难题也意味着确认神经元与权重,这二者与得到想要的输出和改变参数有关。反向传播提供了一个机器学习答案,然而就像下一段讨论的那样,它并非生物学上可信的。寻找一个生物学上可信的机器学习方法进行深度网络中的信任分配是一个主要的长期问题,也是此论文贡献的方向。

此篇论文 Yoshua Bengio 最早发表于 2015 年 2 月,于昨日公开第三次修改版本,读者可点击「阅读原文」进行下载。

640.jpg


摘要

神经科学家长期以来批评深度学习算法与当前的神经生物学知识彼此不相容的现状。我们探索了更加符合生物学逻辑的深度表征学习版本,本文主要关注无监督式学习,但是也关注开发一个能解释监督式、无监督式和强化学习的学习机制。我们要讨论的第一点是,基础的管理突触权重更新(依赖于动作电位尖峰时间的突触可塑性)的学习规则源于一个简单的很有意义的机器学习观点更新规则,并且,只要神经的动态活动能将激发率推向更好地某些目标函数值(可能是监督式、无监督式或奖赏驱动的),就能用梯度下降法将该学习规则集成到这些目标函数中。第二个主要观点是,这与变分 EM 法的形式相对应,也就是使用神经动力学实现的近似而非精确的事后估值。本文的另一个贡献是,需要在上面的变分解释(  variational interpretation  )中更新隐藏层的梯度可以使用近似值来估算,只需要将激活的信息向前和向后传播,并且需要成对的层来学习形成降噪自动编码器。最后,我们拓展了关于自动编码器的概率论解释,从而证明基于降噪自动编码器的生成式解释的改进抽样计划是正确的,而且我们用生成式学习任务证实了这些想法。


导语


深度学习和人工神经网络已经从大脑获得灵感,但大部分是在计算表现形式上的灵感(大多是生物学的,比如 spike 的存在留待考虑)。然而,如今缺少的是对生物神经元中存在的学习规则的一个可信的机器学习说明,从而能够解释一个深度神经网络有效的联合训练,也就是通过一个神经连接长链说明信任分配(credit assignment)。因此,解决信任分配难题也意味着确认神经元与权重,这二者与得到想要的输出和改变参数有关。反向传播提供了一个机器学习答案,然而就像下一段讨论的那样,它并非生物学上可信的。寻找一个生物学上可信的机器学习方法进行深度网络中的信任分配是一个主要的长期问题,也是此论文贡献的方向。


首先,让我们思考一下依赖看起来生物学可信的机制的顶尖的深度学习算法,比如梯度反向传播,这一机制也就是计算一个关于神经激活和参数的目标函数梯度。下列是有关反向传播的生物学可信性的难题:(1)反向传播计算(从输出层到更低的隐层)是纯线性的,然而生物神经元是交错线性和非线性操作的。(2)如果大脑中存在的已知反馈通道(它们自己的突触,或者可能是自己的神经元)被用于通过反向传播来传送信任分配,他们就需要有关操作点(operating point)上非线性关系衍生物的准确知识,在前馈通道上对应的前馈计算上使用到这一操作点。(3)相似的,这些前馈通道也要使用准确的前馈连接的对称权重(有同样连接、转置)。(4)真正的神经元通过(可能是随机的)二进制值(尖峰)通信,而不是完全的连续值。(5)计算必须要精准的在时间上对应前馈和反向传播阶段之间的替换物(因为后者需要前者的结果)。(6)输出目标出自哪里不清楚。此论文中提出的这一方法意图解决所有的这些问题,尽管一些可能的生物实现还留有一些问题,而且更多需要考虑的生物学的细节在此论文中并未涉及到。


注意反向传播不只被用于经典的监督学习,也被用于很多无监督学习算法,包括所有类型的自动编码器:稀疏自动编码器(Ranzato et al., 2007; Goodfellow et al., 2009),降噪自动编码器(Vincent et al., 2008),收缩自动编码器(Rifai et al., 2011)以及更近期的变分自动编码器(Kingma、Welling, 2014)。其他不依赖反向传播的无监督学习算法,比如各种玻尔兹曼机器学习算法(Hinton and Sejnowski, 1986; Smolensky, 1986; Hinton et al., 2006; Salakhutdinov and Hinton, 2009)。玻尔兹曼机可能是最我们目前知道的进行深度架构的最生物学可信的学习算法,但就这一点而言,他们也有数个问题,比如获取对称权重的权重传输问题(上面的问题 3),以及正相 vs 反相的同步问题(类似于上面的问题 5)。


在 Sec.2 中我们首先提出了一个在生物突触中观察到的主要学习规则的解释:脉冲时间相关的突触可塑性(STDP)受到了先前思路的启发(Xie and Seung, 2000; Hinton, 2007),我们首先通过直观的参数和模拟展示,如果神经元只被一个既不增加也不降低神经元激发率的,与有关神经元电势的目标函数梯度成正比的前馈信号驱动的情况下,STDP 能被看做随机梯度下降。


在 Sec.3 中,我们展现了 STDP 的首次机器学习释义,带来了通过多层的有效信用分配。我们首先表示,上面关于 STDP 的解释表明神经动态(它在神经激活中由于反馈和侧壁连接创造了以上变化)相当于对神经结构的推论,这种结构更符合彼此以及观察值(输入、目标或奖励)。当玻尔兹曼机不需要获得来自一个 MCMC 平稳分布( stationary distribution)的表征样本时,这个观点类似于对玻尔兹曼机推论的解释。除了 Hinton 的提议,它天然表明训练流程对应 EM 的一个变分形式(Neal and Hinton, 1999),可能基于 MAP(maximum a posteriori)或者 MCMC (Markov Chain Monte-Carlo)近似。


在 Sec.4 中,我们展示了这一数学框架如何表示对一个带有很多潜在变量层的深度直接生成式网络的训练流程。然而,上面的解释仍然需要计算一些梯度。另一贡献(Sec.6)是表明人们能够通过一个只涉及普通神经计算并且没有明确派生物的近似值来评估这些梯度,这追随了先前在目标传播(Bengio, 2014; Lee et al., 2014)上的研究。我们引入了一个新的针对差异目标传播(Lee et al., 2014)的 justification,利用了这样的一个事实:提出的学习机制能被解释为训练一个降噪自动编码器。就像在 Sec.5 中讨论的,这一模型的解释提供了从中采样的不同方式,而且我们发现能够获得更好的样本。


640.png

相关文章
|
3月前
|
机器学习/深度学习 自然语言处理 数据挖掘
【论文精读】TNNLS 2022 - 基于深度学习的事件抽取研究综述
【论文精读】TNNLS 2022 - 基于深度学习的事件抽取研究综述
|
1月前
|
机器学习/深度学习 自然语言处理 前端开发
2024年3月最新的深度学习论文推荐
现在已经是3月中旬了,我们这次推荐一些2月和3月发布的论文。
46 0
|
2月前
|
机器学习/深度学习 编解码 人工智能
2024年2月深度学习的论文推荐
我们这篇文章将推荐2月份发布的10篇深度学习的论文
56 1
|
8月前
|
机器学习/深度学习 自然语言处理 算法
【论文精读】TNNLS 2022 - 基于深度学习的事件抽取研究综述
事件抽取是从海量文本数据中快速获取事件信息的一项重要研究任务。随着深度学习的快速发展,基于深度学习技术的事件抽取已成为研究热点。文献中提出了许多方法、数据集和评估指标,这增加全面更新调研的需求。
359 0
|
11月前
|
机器学习/深度学习 算法 数据可视化
深度学习论文阅读目标检测篇(一):R-CNN《Rich feature hierarchies for accurate object detection and semantic...》
 过去几年,在经典数据集PASCAL上,物体检测的效果已经达到 一个稳定水平。效果最好的方法是融合了多种低维图像特征和高维上 下文环境的复杂集成系统。在这篇论文里,我们提出了一种简单并且 可扩展的检测算法,可以在VOC2012最好结果的基础上将mAP值提 高30%以上——达到了53.3%。
121 0
深度学习论文阅读目标检测篇(一):R-CNN《Rich feature hierarchies for accurate object detection and semantic...》
|
11月前
|
机器学习/深度学习 自然语言处理
十年来论文量激增,深度学习如何慢慢推开数学推理的门(2)
十年来论文量激增,深度学习如何慢慢推开数学推理的门
|
11月前
|
机器学习/深度学习 消息中间件 人工智能
十年来论文量激增,深度学习如何慢慢推开数学推理的门(1)
十年来论文量激增,深度学习如何慢慢推开数学推理的门
105 0
|
11月前
|
机器学习/深度学习 自然语言处理 算法
深度学习,经典论文盘点!
深度学习,经典论文盘点!
|
11月前
|
机器学习/深度学习 编解码 并行计算
深度学习论文阅读目标检测篇(七)中文版:YOLOv4《Optimal Speed and Accuracy of Object Detection》
大多数基于 CNN 的目标检测器基本上都仅适用于推荐系统。例 如:通过城市摄像头寻找免费停车位,它由精确的慢速模型完成,而 汽车碰撞警报需要由快速、低精度模型完成。改善实时目标检测器的 精度,使其能够不仅可以用于提示生成推荐系统,也可以用于独立的 流程管理和减少人力投入。传统 GPU 使得目标检测可以以实惠的价 格运行。最准确的现代神经网络不是实时运行的,需要大量的训练的 GPU 与大的 mini bacth size。我们通过创建一个 CNN 来解决这样的 问题,在传统的 GPU 上进行实时操作,而对于这些训练只需要一个 传统的 GPU。
190 0
|
11月前
|
机器学习/深度学习 编解码 并行计算
深度学习论文阅读目标检测篇(七)中英对照版:YOLOv4《Optimal Speed and Accuracy of Object Detection》
 有大量的技巧可以提高卷积神经网络(CNN)的精度。需要在大 数据集下对这种技巧的组合进行实际测试,并需要对结果进行理论论 证。某些技巧仅在某些模型上使用和专门针对某些问题,或只针对小 规模的数据集;而一些技巧,如批处理归一化、残差连接等,适用于 大多数的模型、任务和数据集。我们假设这种通用的技巧包括加权残 差连接(Weighted-Residual-Connection,WRC)
220 0