超快、超低能耗!北大团队提出基于卷积神经网络的全光计算

简介: 超快、超低能耗!北大团队提出基于卷积神经网络的全光计算

编辑/凯霞随着先进工程计算、经济数据分析和云计算的快速发展,对超高速和高能效计算的需求呈指数级增长。现有的冯诺依曼架构下的传统电子信号处理器难以同时实现高速和低能耗。使用光子作为信息载体是一种很有前景的选择。由于传统材料的三阶非线性光学较弱,在传统冯诺依曼架构下构建集成光子计算芯片一直是一个挑战。近日,由北京大学物理学院龚旗煌研究团队提出了一种基于卷积神经网络(CNN)实现超快超低能耗全光计算芯片方案的新策略,支持多计算任务的执行。这项工作为下一代全光计算系统指明了方向。该研究以「All-optical computing based on convolutional neural networks」为题,于 11 月 25 日发表在《Opto-Electronic Advances》上。

电子向光子的转变

现有的计算仪器以电子处理器为主,以电子为信息载体,具有冯诺依曼架构,存储与处理物理分离。计算速度的扩展不仅受到内存和处理单元之间的数据传输的限制,还受到与集成电路相关的 RC 延迟的限制。此外,由于欧姆损耗导致的过度加热正在成为速度和功耗缩放的严重瓶颈。采用光子作为信息载体的全光计算提供了一种有前途的替代方法。当前,光计算通常依靠三阶非线性光学来实现全光控制。然而,超快的响应时间和巨大的非线性通常在光学材料中呈现出一种固有的权衡,因此较大的非线性敏感性通常只能以较慢的响应时间为代价来获得。这种权衡对构建遵循冯诺依曼架构的集成光子处理器提出了重大挑战,通常要求在单个芯片中进行各种光子器件的复杂异构集成。因此,为全光计算探索新的架构和非常规的计算方案势在必行。在这里,报告了一种实现超快、超低能耗全光计算的新策略,包括方程求解、基于 CNN 的多功能逻辑运算。研究人员表示:这是第一个在全光学芯片上实现物理固定的 CNN。

全光计算框架通用架构。

光学 CNN 由级联硅 Y 形波导和侧耦合硅波导段组成,以实现每个波导分支中的完整相位和幅度控制。这种概念和架构简单的设计独特地提供了超快的计算时间和低能耗。

全光计算性能

通用设备概念可用于方程求解、多功能逻辑运算以及许多其他数学运算。接下来,通过实验证明了包括超越方程求解器、各种逻辑门算子和半加器在内的多种计算功能,以验证全光计算性能。全光超越方程求解器方程是描述系统状态和过程的有效工具,求解方程可以告知所研究系统的状态并预测系统演化的轨迹。由于超越方程除少数情况外只能进行数值求解,因此超越方程的数值求解仍然是数学计算中的一个重要课题。该团队开发了一种求解器,它可以使用具有出色计算性能的光学 CNN 可预测地求解超越方程。

全光超越方程求解器。

测试结果表明,本文提出的超越方程求解器具有较高的求解精度,最大偏差小于 5%,多数情况下偏差小于 3%。这种偏差是由于输出波导数量有限和样品制作不完善造成的。因此,需要强调的是,理论上可以通过增加输出波导的数量来提高求解的精度。除了出色的求解精度外,全光学方程求解器还具有超快(通过特征结构的光的飞行时间为~1.3 ps)和能效计算(~92 fJ/bit)的特点。多种逻辑门运算符全光逻辑门构成了超高速全光芯片的基本构建块,任何复杂的光逻辑电路都可以由这些逻辑门组成。此外,逻辑运算为更复杂的光信号处理功能奠定了基础。然而,目前基于信号光线性相干或非线性相互作用的全光逻辑器件设计在实现高速、低功耗的可重构性和多功能操作(在单个芯片中实现多个逻辑功能)方面仍然面临挑战。研究人员利用网络的可扩展性来优化片上全光多种逻辑设备。该设计优化了 6 个输入端口,包括 2 个信号输入端和 4 个控制位,共 5 层。通过七种不同的 CNN 结构可以实现 16 种逻辑函数。选择其中一种光学 CNN 结构进行了说明。

多种逻辑门。

研究表明,可以实现低至 10.4 aJ/bit 的能耗,同时保持低错误率。此外,光学 CNN 的输出逻辑状态在执行多个逻辑功能时很容易区分。也就是说,未来更多的级联扩展可能仍然有效。半加器全光半加器可以执行将两个输入数据位相加并在全光实现中产生一个和位和一个进位位的计算任务。在这里,展示了一个基于其光学 CNN 平台的全光学半加器。

半加器。

通过算法优化确定了 12 个网络权重。逻辑状态 0 和 1 之间的平均光强对比度为 14.2 dB。飞行时间计算时间为 2.7 ps,能耗为 50.8 fJ/bit。进一步分析表明,可以实现低至 23.8 aJ/bit 的能耗,同时保持 10^-9 的低错误率。在实现高强度对比度的同时成功展示了半加器的功能,这进一步验证了 CNN 设计的高度可扩展性和广泛适用于各种全光处理功能。

超快和超低能耗

总之,研究人员通过实验证明了第一个基于硅波导的用于全光计算的物理固定 CNN。实现了设计以实现全光超越方程求解器、各种逻辑门算子和半加器,所有这些都表现出皮秒级超快运算和每比特数十飞焦量级的超低能耗。这种光网络架构易于扩展,有可能通过级联基本元素结构进一步扩展以执行其他复杂的计算任务。此外,该平台提供了使用波长复用进行并行计算的可能性。因此,该工作为下一代全光计算系统指明了一个有希望的方向。

论文链接:https://www.oejournal.org/article/doi/10.29026/oea.2021.200060

参考内容:https://phys.org/news/2021-11-all-optical-based-convolutional-neural-networks.html

相关文章
|
14天前
|
机器学习/深度学习 计算机视觉 Python
【YOLOv11改进 - 注意力机制】SimAM:轻量级注意力机制,解锁卷积神经网络新潜力
【YOLOv11改进 - 注意力机制】SimAM:轻量级注意力机制,解锁卷积神经网络新潜力本文提出了一种简单且高效的卷积神经网络(ConvNets)注意力模块——SimAM。与现有模块不同,SimAM通过优化能量函数推断特征图的3D注意力权重,无需添加额外参数。SimAM基于空间抑制理论设计,通过简单的解决方案实现高效计算,提升卷积神经网络的表征能力。代码已在Pytorch-SimAM开源。
【YOLOv11改进 - 注意力机制】SimAM:轻量级注意力机制,解锁卷积神经网络新潜力
|
8天前
|
机器学习/深度学习 人工智能 自然语言处理
深度学习中的卷积神经网络:从理论到实践
【10月更文挑战第35天】在人工智能的浪潮中,深度学习技术以其强大的数据处理能力成为科技界的宠儿。其中,卷积神经网络(CNN)作为深度学习的一个重要分支,在图像识别和视频分析等领域展现出了惊人的潜力。本文将深入浅出地介绍CNN的工作原理,并结合实际代码示例,带领读者从零开始构建一个简单的CNN模型,探索其在图像分类任务中的应用。通过本文,读者不仅能够理解CNN背后的数学原理,还能学会如何利用现代深度学习框架实现自己的CNN模型。
|
7天前
|
机器学习/深度学习 人工智能 算法框架/工具
深度学习中的卷积神经网络(CNN)及其在图像识别中的应用
【10月更文挑战第36天】探索卷积神经网络(CNN)的神秘面纱,揭示其在图像识别领域的威力。本文将带你了解CNN的核心概念,并通过实际代码示例,展示如何构建和训练一个简单的CNN模型。无论你是深度学习的初学者还是希望深化理解,这篇文章都将为你提供有价值的见解。
|
18天前
|
机器学习/深度学习 监控 自动驾驶
卷积神经网络有什么应用场景
【10月更文挑战第23天】卷积神经网络有什么应用场景
18 2
|
18天前
|
机器学习/深度学习 自然语言处理 算法
什么是卷积神经网络
【10月更文挑战第23天】什么是卷积神经网络
24 1
|
21天前
|
机器学习/深度学习 人工智能 算法
【车辆车型识别】Python+卷积神经网络算法+深度学习+人工智能+TensorFlow+算法模型
车辆车型识别,使用Python作为主要编程语言,通过收集多种车辆车型图像数据集,然后基于TensorFlow搭建卷积网络算法模型,并对数据集进行训练,最后得到一个识别精度较高的模型文件。再基于Django搭建web网页端操作界面,实现用户上传一张车辆图片识别其类型。
65 0
【车辆车型识别】Python+卷积神经网络算法+深度学习+人工智能+TensorFlow+算法模型
|
8天前
|
机器学习/深度学习 人工智能 自动驾驶
深入解析深度学习中的卷积神经网络(CNN)
深入解析深度学习中的卷积神经网络(CNN)
22 0
|
11天前
|
机器学习/深度学习 人工智能 TensorFlow
深度学习中的卷积神经网络(CNN)及其在图像识别中的应用
【10月更文挑战第32天】本文将介绍深度学习中的一个重要分支——卷积神经网络(CNN),以及其在图像识别领域的应用。我们将通过一个简单的代码示例,展示如何使用Python和TensorFlow库构建一个基本的CNN模型,并对其进行训练和测试。
|
17天前
|
机器学习/深度学习 自然语言处理 TensorFlow
深度学习中的卷积神经网络(CNN)及其应用
【10月更文挑战第26天】在这篇文章中,我们将深入探讨卷积神经网络(CNN)的基本原理、结构和应用。CNN是深度学习领域的一个重要分支,广泛应用于图像识别、语音处理等领域。我们将通过代码示例和实际应用案例,帮助读者更好地理解CNN的概念和应用。
|
19天前
|
机器学习/深度学习 算法 计算机视觉
深度学习与生活:如何利用卷积神经网络识别日常物品
【10月更文挑战第24天】在这篇文章中,我们将探索深度学习如何从理论走向实践,特别是卷积神经网络(CNN)在图像识别中的应用。通过一个简单的示例,我们将了解如何使用CNN来识别日常生活中的物体,如水果和家具。这不仅是对深度学习概念的一次直观体验,也是对技术如何融入日常生活的一次深刻反思。文章将引导读者思考技术背后的哲理,以及它如何影响我们的生活和思维方式。

热门文章

最新文章