使用拓扑数据分析理解卷积神经网络模型的工作过程

简介: 神经网络功能强大,但内部复杂且不透明,被称为黑匣子工具。使用拓扑数据分析以紧凑且可理解的方式描述卷积神经网络的功能和学习过程。

1.简介

       神经网络在各种数据方面处理上已经取得了很大的成功,包括图像、文本、时间序列等。然而,学术界或工业界都面临的一个问题是,不能以任何细节来理解其工作的过程,只能通过实验来检测其效果,而无法做出合理的解释。相关问题是对特定数据集经常存在某种过拟合现象,这会导致对抗行为的可能性。出于这些原因,开发用于发展对神经网络的内部状态的一些理解的方法是非常值得尝试的。由于网络中神经元的数量非常庞大,这成为使得对其进行数据分析显得比较困难,尤其是对于无监督数据分析。
       在这篇文章中,将讨论如何使用拓扑数据分析来深入了解卷积神经网络(CNN)的工作过程。本文所举示例完全来自对图像数据集进行训练的网络,但我们确信拓扑建模可以很容易地解释许多其他领域卷积网络的工作过程。
       首先,对于神经网络而言,一般是由节点和有向边组成。一些节点被指定为输入节点,其他节点被指定为输出节点,其余节点被指定为内部节点。输入节点是数据集的特征。例如,在处理图像时,输入节点将是特定图像格式的像素。在文本分析时,它又可能是单词。假设给定一个数据集和一个分类问题,比如手写数字MNIST数据集,试图将每个图像分类为数字0到9中的某一个数字。网络的每个节点对应于一个变量值(激活值)。因此,每个数据点为神经网络中的每个内部和输出节点生成值。网络每个节点的值由分配给每个边的权重系统决定。节点节点Z上的值由与之连接的节点A,B,C,D节点的激活函数来确定。

1
图1 神经网络节点示例


       基于分配给四条边的的权重值,计算最右边节点Z的激活值。一种可能的函数形式就是

$$ (wAxA + wBxB + wCxC + wDxD) $$


       其中wA,wB,wC和wD是与边缘AZ,BZ,CZ和DZ的权重值,xA,xB,xC和xD分别是节点A,B,C和D处的激活值,取值范围通常在0和1之间,并且通常是单调的。权重的选择是通过输出函数来进行优化的,给定输入的特定输出函数(代价函数或损失函数),然后使用优化过程来选择所有权重,以便最佳地适合给定的输出函数,对这方面感兴趣的读者可以查阅梯度下降算法和反向传播算法相关资料。

2.理解训练网络的权重

       有一类神经网络在图像处理领域取得了很好的成绩,即卷积神经网络。在这种情况下,输入节点被布置在对应于像素矩阵的方形网格中,用于构成图像的数据。网络模型由一系列图层组成,且每层之间都有连接,即第i层的节点与位于第(i + 1)层的节点之间有连接。不同于一般的神经网络,典型的卷积神经网络由卷积层(convolutional layers )、采样层(Pooling layer)以及全连接层(fully-connected)组成,其中卷积层主要是用于提取图像特征,采样层用于降低特征的维度,全连接层用于最后的分类目的,随着层与层之间的处理,特征图会变得越来越小,从图中也可以看见这种现象:

2
图2 卷积神经网络的典型结构


       为了理解卷积神经网络的潜在行为,需要对权重矩阵进行了解。假设一个数据集,其中每个数据点是与隐藏层中的神经元相关联的权重矩阵。从固定层的所有网格中收集数据,并在同一网络模型对同一数据集进行许多次的训练。最后,对权重矩阵进行拓扑数据分析。
       通过对权重矩阵执行TDA,我们首次了解了卷积神经网络的行为,独立证明卷积神经网络完全地表示自然图像中发生的潜在分布,这是如何完成的呢?
       首先,需要从拓扑角度找到有用的结构。为了实现这个目标,只考虑密度足够高的点。首先看一下两层卷积神经网络中的第一个卷积层,它产生图3所示的拓扑模型。

3
图3 根据过滤器的密度着色的TDA Mapper模型


       从图中可以看到,该模型是循环的。右侧显示的条形码为持久性同源条形码,它们是拓扑形状的签名,表明数据集实际具有这种形状,并且它不是使用 Mapper构建模型的构建。通过用相应权重矩阵的平均值标记部分模型,图像中也显示了对形状的解释。此外,这个模型的有趣之处在于 灰度自然图像中统计3×3图像块的研究中发现的内容与在所谓的初级视觉皮层中发现的内容完全一致。
       更简单地说,拓扑模型以这样一种方式描述CNN,即可以独立地确认它与人类看待世界的方式相匹配,并与自然图像的密度分析相匹配。
       图3中的分析是在 MNIST数据集上进行的,对 CIFAR 10数据集上执行的相关分析获得下图:

4
图4 CIFAR 10数据集的额外复杂性显示在水平线和垂直线上


       上图是对第一个卷积层进行分析,该模型在区域中间以及边缘包含线条。观察到这些线条块的神经元也存在于哺乳动物的初级视觉皮层中,这为我们提供了与视觉相关的质量方面的量化视角。

3.理解权重在训练过程中的变化

       从上面的发现可以看到,使用TDA,卷积神经网络可以模拟自然图像中数据集的分布,因此可以将注意力转向研究学习过程中发生的事情。图5是通过在CIFAR10数据集上计算卷积神经网络的第一层和第二层中的拓扑模型,然后在不同次数的学习迭代中显示模型的第一层和第二层而获得。

FIg5GCNN
图5 神经网络模型各个阶段的拓扑模型


       对模型进行着色来获取模型进行处理的信息,颜色反映了节点中数据点的数量,因此可以将红色部分视为实际模型,其余部分包含不常出现的权重矩阵。
       图像中的第一行反映第一层的信息,并且观察到,优化算法进行400和500次迭代后快速发现上述圆形模型。然而,随着迭代的过程,圆形变为更复杂,其中包括与水平和垂直补丁相对应的补丁,1000次迭代后,模型中心变得更复杂。另一方面,对于第二层,在迭代的第一轮中可以看到,只有一个弱模式,但是在2000次迭代之后,似乎具有一个明确定义的圆形模型。我们对其进行假设——第二层已经“接管”了第一层,而第一层已经转移到捕获更复杂的补丁,这是未来潜在研究的一个领域。这也证明了使用拓扑数据分析来监控和提供对神经网络学习过程的洞察力的能力。

4.更高层的权重矩阵

       这种方法也适用于更深的网络,更深的网络的组织方式类似于人类或灵长类动物视觉通路的组织。应理解,该通路具有许多组分,包括视网膜,以及各种较高组分。初级视觉皮层充当边缘和线检测器,并且更高的组件用来检测更为复杂的形状,更为抽象。下图是对已经训练好VGG 16网络中各层的研究结果。这里显示第2到第13卷积层的拓扑数据分析,给出对应的拓扑模型。

6
图6 以拓扑数据分析为代表的13层神经网络


       注意到,第二层和第三层显然非常类似于在MNIST数据集上训练的模型中获得的圆形模型。第四层有一个圆形模型,但也包含一些背景中的一些线条。然而,在更高层次上,开发出了非常有趣的模式,包括线条交叉和“牛眼”。
       从这些拓扑模型可以发现,卷积神经网络不仅模仿真实世界数据集的分布,而且还能够模拟哺乳动物视觉皮层的发展。
       虽然卷积神经网络像一个黑匣子一样让人难以理解,但拓扑数据分析提供了一种在宏观尺度上理解神经网络中计算是如何被执行的方法。虽然这项工作适用于图像数据集,但使用拓扑数据分析来解释其他领域神经网络的计算同样也适用。
        通过将大量状态压缩成更小更易理解的模型,拓扑数据分析可用于理解宽范围神经网络的行为和功能

数十款阿里云产品限时折扣中,赶紧点击领劵开始云上实践吧!

作者信息

Gunnar Carlsson,机器学习研究者
个人主页:https://www.linkedin.com/in/gunnar-carlsson-17b3727/
本文由阿里云云栖社区组织翻译。
文章原标题《Using Topological Data Analysis to Understand the Behavior of Convolutional Neural Networks》,译者:海棠,审校:Uncle_LLD。
文章为简译,更为详细的内容,请查看原文

相关文章
|
14天前
|
机器学习/深度学习 人工智能 算法
基于Python深度学习的眼疾识别系统实现~人工智能+卷积网络算法
眼疾识别系统,本系统使用Python作为主要开发语言,基于TensorFlow搭建卷积神经网络算法,并收集了4种常见的眼疾图像数据集(白内障、糖尿病性视网膜病变、青光眼和正常眼睛) 再使用通过搭建的算法模型对数据集进行训练得到一个识别精度较高的模型,然后保存为为本地h5格式文件。最后使用Django框架搭建了一个Web网页平台可视化操作界面,实现用户上传一张眼疾图片识别其名称。
72 4
基于Python深度学习的眼疾识别系统实现~人工智能+卷积网络算法
|
1月前
|
机器学习/深度学习 人工智能 算法
猫狗宠物识别系统Python+TensorFlow+人工智能+深度学习+卷积网络算法
宠物识别系统使用Python和TensorFlow搭建卷积神经网络,基于37种常见猫狗数据集训练高精度模型,并保存为h5格式。通过Django框架搭建Web平台,用户上传宠物图片即可识别其名称,提供便捷的宠物识别服务。
287 55
|
1月前
|
机器学习/深度学习 人工智能 算法
【宠物识别系统】Python+卷积神经网络算法+深度学习+人工智能+TensorFlow+图像识别
宠物识别系统,本系统使用Python作为主要开发语言,基于TensorFlow搭建卷积神经网络算法,并收集了37种常见的猫狗宠物种类数据集【'阿比西尼亚猫(Abyssinian)', '孟加拉猫(Bengal)', '暹罗猫(Birman)', '孟买猫(Bombay)', '英国短毛猫(British Shorthair)', '埃及猫(Egyptian Mau)', '缅因猫(Maine Coon)', '波斯猫(Persian)', '布偶猫(Ragdoll)', '俄罗斯蓝猫(Russian Blue)', '暹罗猫(Siamese)', '斯芬克斯猫(Sphynx)', '美国斗牛犬
190 29
【宠物识别系统】Python+卷积神经网络算法+深度学习+人工智能+TensorFlow+图像识别
|
11天前
|
机器学习/深度学习 算法 计算机视觉
基于CNN卷积神经网络的金融数据预测matlab仿真,对比BP,RBF,LSTM
本项目基于MATLAB2022A,利用CNN卷积神经网络对金融数据进行预测,并与BP、RBF和LSTM网络对比。核心程序通过处理历史价格数据,训练并测试各模型,展示预测结果及误差分析。CNN通过卷积层捕捉局部特征,BP网络学习非线性映射,RBF网络进行局部逼近,LSTM解决长序列预测中的梯度问题。实验结果表明各模型在金融数据预测中的表现差异。
|
5天前
|
边缘计算 负载均衡 监控
静态代理IP与动态网络拓扑的协同发展
随着科技和互联网的发展,越来越多企业依赖代理服务。静态代理IP与网络拓扑结构的有效融合能显著提升网络性能、安全性和管理效率。通过合理设计网络拓扑、分配静态代理IP,并结合监控和安全策略,可优化数据流、实现负载均衡,确保高效安全的数据传输。未来,云计算、边缘计算及AI技术将进一步推动这一融合,形成更灵活高效的网络架构。
16 1
|
1月前
|
运维 监控 安全
公司监控软件:SAS 数据分析引擎驱动网络异常精准检测
在数字化商业环境中,企业网络系统面临复杂威胁。SAS 数据分析引擎凭借高效处理能力,成为网络异常检测的关键技术。通过统计分析、时间序列分析等方法,SAS 帮助企业及时发现并处理异常流量,确保网络安全和业务连续性。
55 11
|
1月前
|
机器学习/深度学习 资源调度 算法
图卷积网络入门:数学基础与架构设计
本文系统地阐述了图卷积网络的架构原理。通过简化数学表述并聚焦于矩阵运算的核心概念,详细解析了GCN的工作机制。
124 3
图卷积网络入门:数学基础与架构设计
|
28天前
|
网络协议 安全 网络安全
探索网络模型与协议:从OSI到HTTPs的原理解析
OSI七层网络模型和TCP/IP四层模型是理解和设计计算机网络的框架。OSI模型包括物理层、数据链路层、网络层、传输层、会话层、表示层和应用层,而TCP/IP模型则简化为链路层、网络层、传输层和 HTTPS协议基于HTTP并通过TLS/SSL加密数据,确保安全传输。其连接过程涉及TCP三次握手、SSL证书验证、对称密钥交换等步骤,以保障通信的安全性和完整性。数字信封技术使用非对称加密和数字证书确保数据的机密性和身份认证。 浏览器通过Https访问网站的过程包括输入网址、DNS解析、建立TCP连接、发送HTTPS请求、接收响应、验证证书和解析网页内容等步骤,确保用户与服务器之间的安全通信。
103 1
|
1月前
|
监控 安全 BI
什么是零信任模型?如何实施以保证网络安全?
随着数字化转型,网络边界不断变化,组织需采用新的安全方法。零信任基于“永不信任,永远验证”原则,强调无论内外部,任何用户、设备或网络都不可信任。该模型包括微分段、多因素身份验证、单点登录、最小特权原则、持续监控和审核用户活动、监控设备等核心准则,以实现强大的网络安全态势。
132 2
|
1月前
|
机器学习/深度学习 人工智能 自然语言处理
深入理解深度学习中的卷积神经网络(CNN)##
在当今的人工智能领域,深度学习已成为推动技术革新的核心力量之一。其中,卷积神经网络(CNN)作为深度学习的一个重要分支,因其在图像和视频处理方面的卓越性能而备受关注。本文旨在深入探讨CNN的基本原理、结构及其在实际应用中的表现,为读者提供一个全面了解CNN的窗口。 ##

热门文章

最新文章