【博士每天一篇文献-算法】CircuitNet:A Generic Neural Network to Realize Universal Circuit Motif Modeling

简介: 本文介绍了CircuitNet,这是一种新型神经网络,它受到神经回路结构的启发,通过使用电路基元单元(CMUs)来模拟通用电路基元,并通过调整CMU内部权重来实现建模,在多种机器学习任务中展现出优于传统前馈网络的性能。

阅读时间:2023-11-28

1 介绍

年份:2023
作者:王燕森、姜新阳,微软研究院
期刊: International Conference on Machine Learning. PMLR, 2023
引用量:0

这篇论文介绍了电路神经网络(CircuitNet),这是一种受神经回路结构启发的新型神经网络。CircuitNet使用称为电路基元单元(CMUs)的密集连接神经元来模拟通用电路基元通过调整CMU内的权重。通过整合反馈和横向结构,CircuitNet在各种机器学习任务中表现出优于传统前馈网络的性能,如函数逼近、强化学习、图像分类和时间序列预测。CircuitNet的设计遵循包含不同类型电路基元和形成局部密集和全局稀疏神经元连接的原则,灵感来自人类大脑的结构。该文档强调了神经科学对深度学习的启发作用,并展示了CircuitNet在改进性能方面以比流行的神经网络架构拥有更少参数的潜力。实验展示了在各种任务中出色的结果,展示了该模型的有效性和在机器学习未来发展中的潜力。

2 创新点

(1)提出了一种受到神经元电路结构启发的新型神经网络——电路神经网络(CircuitNet)。该网络利用密集连接的神经元(称为电路基元单元,CMUs)来模拟通用电路结构,通过调整CMUs内的权重来进行建模。(2)CircuitNet 在各种机器学习任务中表现优异,如函数逼近、强化学习、图像分类和时间序列预测等领域,超越传统前馈网络。
(3)设计了包含反馈和侧向电路结构的CircuitNet,使其能够在各种任务中取得优异表现。
(4)通过在CMUs中包含不同类型的电路基元,并形成局部密集和全局稀疏的神经元连接,遵循人脑结构的原则,提高模型性能。
(5)实验结果证明,CircuitNet 在各种任务中表现出色,显示了其在减少参数的情况下改善性能的潜力。

3 相关研究

(1)基本概念
神经科学的一系列进展揭示了神经元通过各种连接模式相互交互,即电路图案(Luo, 2021)。存在四种最常见的电路图案类型,包括前馈兴奋和抑制、反馈抑制、侧向抑制和相互抑制。
截屏2024-03-08 下午2.30.50.png
(2)相关研究
《Towards biologically plausible deep learning.2015》生物启发网络:
《Recurrence is required to capture the representational dynamics of the human visual system,2019》《Going in circles is the way forward: the role of recurrence in visual inference,2020》模拟了人类大脑中级联结构内部和阶段之间的反复连接,深度神经网络中存在数据的差异。
《Accurate reconstruction of image stimuli from human functional magnetic resonance imaging based on the decoding model with capsule network architecture.2018》受人类视觉皮层中视觉信息表达的启发,胶囊神经网络向卷积神经网络添加了称为“胶囊”的结构,每个胶囊代表一个对象或对象部分,它们的组合形成更稳定的表达。

(3)启发
CircuitNet使用密集连接的神经元作为基本的功能结构,称为电路图元(CMU),以支持通用电路图案。不同CMU之间的通信是通过连接到CMU中特定神经元子集的稀疏连接实现的,即输入/输出端口。
本文启发于《Architectures of neuronal circuits》

4 算法

设计一个能模拟四种神经元连接模式(即电路模式)的转换函数,包括前馈、相互、反馈和侧向模式。在前馈和相互模式中,输入信号仅取决于前一个神经元的状态,而在另外两种模式中,输入信号可能会受到另一个神经元或目标神经元本身状态的影响。
(1)用自注意机制来表示为神经元关注

(2)模拟连接神经元之间的信号传输
截屏2024-03-08 下午2.59.38.png
其中 $ W_{ijk} $​是一个可学习的参数,用来模拟来自xj​,xk​到xi​的影响强度。除以2是为了消除二次项引起的梯度影响。神经元的乘积,用于模拟输入信号之间的相互作用。同时使用神经元之间的乘积和线性转换用于模拟通用电路模式。
(3)电路基元单元(CMU)组成CircuitNet
每个CMU单元有M个神经元。CMU之间通过它们的输入/输出端口稀疏连接。
截屏2024-03-08 下午3.07.29.png
其中,$ W_{ji} $是从第j个CMU到第i个CMU的可学习线性转换。$ P_{in} $、 $ P_{out} $是具有p个非零元素的二进制向量,标识哪些p个神经元是输入或输出端口,◦是逐元素乘法,处理接收或发送CMU信号时选择这些神经元。
截屏2024-03-08 下午3.04.16.png

5 思考

网络结构倒是挺简单的,就是论文没有提供源码,想知道如何实现的。

目录
相关文章
|
1月前
|
机器学习/深度学习 人工智能 资源调度
【博士每天一篇文献-算法】连续学习算法之HAT: Overcoming catastrophic forgetting with hard attention to the task
本文介绍了一种名为Hard Attention to the Task (HAT)的连续学习算法,通过学习几乎二值的注意力向量来克服灾难性遗忘问题,同时不影响当前任务的学习,并通过实验验证了其在减少遗忘方面的有效性。
40 12
|
1月前
|
机器学习/深度学习 算法 计算机视觉
【博士每天一篇文献-算法】持续学习经典算法之LwF: Learning without forgetting
LwF(Learning without Forgetting)是一种机器学习方法,通过知识蒸馏损失来在训练新任务时保留旧任务的知识,无需旧任务数据,有效解决了神经网络学习新任务时可能发生的灾难性遗忘问题。
70 9
|
1月前
|
机器学习/深度学习 算法 机器人
【博士每天一篇文献-算法】改进的PNN架构Lifelong learning with dynamically expandable networks
本文介绍了一种名为Dynamically Expandable Network(DEN)的深度神经网络架构,它能够在学习新任务的同时保持对旧任务的记忆,并通过动态扩展网络容量和选择性重训练机制,有效防止语义漂移,实现终身学习。
42 9
|
1月前
|
存储 机器学习/深度学习 算法
【博士每天一篇文献-算法】连续学习算法之HNet:Continual learning with hypernetworks
本文提出了一种基于任务条件超网络(Hypernetworks)的持续学习模型,通过超网络生成目标网络权重并结合正则化技术减少灾难性遗忘,实现有效的任务顺序学习与长期记忆保持。
29 4
|
1月前
|
存储 机器学习/深度学习 算法
【博士每天一篇文献-算法】连续学习算法之RWalk:Riemannian Walk for Incremental Learning Understanding
RWalk算法是一种增量学习框架,通过结合EWC++和修改版的Path Integral算法,并采用不同的采样策略存储先前任务的代表性子集,以量化和平衡遗忘和固执,实现在学习新任务的同时保留旧任务的知识。
68 3
|
12天前
|
算法 BI Serverless
基于鱼群算法的散热片形状优化matlab仿真
本研究利用浴盆曲线模拟空隙外形,并通过鱼群算法(FSA)优化浴盆曲线参数,以获得最佳孔隙度值及对应的R值。FSA通过模拟鱼群的聚群、避障和觅食行为,实现高效全局搜索。具体步骤包括初始化鱼群、计算适应度值、更新位置及判断终止条件。最终确定散热片的最佳形状参数。仿真结果显示该方法能显著提高优化效率。相关代码使用MATLAB 2022a实现。
|
12天前
|
算法 数据可视化
基于SSA奇异谱分析算法的时间序列趋势线提取matlab仿真
奇异谱分析(SSA)是一种基于奇异值分解(SVD)和轨迹矩阵的非线性、非参数时间序列分析方法,适用于提取趋势、周期性和噪声成分。本项目使用MATLAB 2022a版本实现从强干扰序列中提取趋势线,并通过可视化展示了原时间序列与提取的趋势分量。代码实现了滑动窗口下的奇异值分解和分组重构,适用于非线性和非平稳时间序列分析。此方法在气候变化、金融市场和生物医学信号处理等领域有广泛应用。
|
1月前
|
算法
基于模糊控制算法的倒立摆控制系统matlab仿真
本项目构建了一个基于模糊控制算法的倒立摆控制系统,利用MATLAB 2022a实现了从不稳定到稳定状态的转变,并输出了相应的动画和收敛过程。模糊控制器通过对小车位置与摆的角度误差及其变化量进行模糊化处理,依据预设的模糊规则库进行模糊推理并最终去模糊化为精确的控制量,成功地使倒立摆维持在直立位置。该方法无需精确数学模型,适用于处理系统的非线性和不确定性。
基于模糊控制算法的倒立摆控制系统matlab仿真
|
13天前
|
资源调度 算法
基于迭代扩展卡尔曼滤波算法的倒立摆控制系统matlab仿真
本课题研究基于迭代扩展卡尔曼滤波算法的倒立摆控制系统,并对比UKF、EKF、迭代UKF和迭代EKF的控制效果。倒立摆作为典型的非线性系统,适用于评估不同滤波方法的性能。UKF采用无迹变换逼近非线性函数,避免了EKF中的截断误差;EKF则通过泰勒级数展开近似非线性函数;迭代EKF和迭代UKF通过多次迭代提高状态估计精度。系统使用MATLAB 2022a进行仿真和分析,结果显示UKF和迭代UKF在非线性强的系统中表现更佳,但计算复杂度较高;EKF和迭代EKF则更适合维数较高或计算受限的场景。
|
14天前
|
算法
基于SIR模型的疫情发展趋势预测算法matlab仿真
该程序基于SIR模型预测疫情发展趋势,通过MATLAB 2022a版实现病例增长拟合分析,比较疫情防控力度。使用SIR微分方程模型拟合疫情发展过程,优化参数并求解微分方程组以预测易感者(S)、感染者(I)和移除者(R)的数量变化。![]该模型将总人群分为S、I、R三部分,通过解析或数值求解微分方程组预测疫情趋势。