清华光学 AI 登 Nature!物理神经网络,反向传播不需要了
用光训练神经网络,清华成果最新登上了 Nature!
无法应用反向传播算法怎么办?
他们提出了一种全前向模式(Fully Forward Mode,FFM)的训练方法,在物理光学系统中直接执行训练过程,克服了传统基于数字计算机模拟的限制。
简单点说,以前需要对物理系统进行详细建模,然后在计算机上模拟这些模型来训练网络。而 FFM 方法省去了建模过程,允许系统直接使用实验数据进行学习和优化。
这也意味着,训练不需要再从后向前检查每一层(反向传播),而是可以直接从前向后更新网络的参数。
打个比方,就像拼图一样,反向传播需要先看到最终图片(输出),然后逆向一块块检查复原;而 FFM 方法更像手中已有部分完成的拼图,只需按照一些光原理(对称互易性)继续填充,而无需回头检查之前的拼图。
这样下来,使用 FFM优势也很明显:
一是减少了对数学模型的依赖,可以避免模型不准确带来的问题;二是节省了时间(同时能耗更低),使用光学系统可以并行处理大量的数据和操作,消除反向传播也减少了整个网络中需要检查和调整的步骤。
论文共同一作是来自清华的薛智威、周天贶,通讯作者是清华的方璐教授、戴琼海院士。此外,清华电子系徐智昊、之江实验室虞绍良也参与了这项研究。
消除反向传播
一句话概括 FFM 原理:
将光学系统映射为参数化的现场神经网络,通过测量输出光场来计算梯度,并使用梯度下降算法更新参数。
简单说就是让光学系统自学,通过观察自己如何处理光线(即测量输出光场)来了解自己的表现,然后利用这些信息来逐步调整自己的设置(参数)。
下图展示了 FFM 在光学系统中的运行机制:
其中 a 为传统设计方法的局限性;b 为光学系统的组成;c 为光学系统到神经网络的映射。
展开来说,一般的光学系统(b),包括自由空间透镜光学和集成光子学,由调制区域(暗绿色)和传播区域(浅绿色)组成。在这些区域中,调制区域的折射率是可调的,而传播区域的折射率是固定的。
而这里的调制和传播区域可以映射到神经网络中的权重和神经元连接。
在神经网络中,这些可调整的部分就像是神经元之间的连接点,可以改变它们的强度(权重)来学习。
利用空间对称互易性原理,数据和误差计算可以共享相同的前向物理传播过程和测量方法。
这有点像镜子里的反射,系统中的每个部分都能以相同的方式响应光的传播和错误反馈。这意味着无论光如何进入系统,系统都能以一致的方式处理它,并根据结果来调整自己。
这样,可以在现场直接计算梯度,用于更新设计区域内的折射率,从而优化系统性能。
通过现场梯度下降方法,光学系统可以逐步调整其参数,直至达到最优状态。
原文将上述全前向模式的梯度下降方法(替代反向传播)用方程最终表示为:
一种光学神经网络训练方法
作为一种光学神经网络训练的方法,FFM 有以下优势:
与理想模型相当的准确率
使用 FFM 可以在自由空间光学神经网络(Optical Neural Network,ONN)上实现有效的自训练过程。
要说明这个结论,研究人员首先用一个单层的ONN 在基准数据集上进行了对象分类训练(a)。
具体来说,他们用了一些手写数字的图片(MNIST 数据集)来训练这个系统,然后将结果进行了可视化(b)。
结果显示,通过 FFM 学习训练的 ONN 在实验光场与理论光场之间相似性极高(SSIM 超过 0.97)。
换句话说,它学习得非常好,几乎能够完美复制给它的示例。
不过研究人员也提醒:
由于系统存在的不完美之处,理论上计算出的光场和梯度无法完全准确地反映实际物理现象。
接下来,研究人员用更复杂的图片(Fashion-MNIST 数据集)来训练系统识别不同的时尚物品。
一开始,当层数从 2 层增加到 8 层,计算机训练网络的平均准确度几乎只有理论准确度的一半。
而通过 FFM 学习方法,系统的网络准确度提升到 92.5%,接近理论值。
这表明了,随着网络层数的增加,传统方法训练的网络性能下降,而 FFM 学习能够维持高精度。
同时,通过将非线性激活纳入 FFM 学习,可以进一步提升 ONN 的性能。在实验中,非线性 FFM 学习能够将分类准确率从 90.4% 提高到 93.0%。
研究进一步证明,通过批量训练非线性 ONN,错误传播过程可以被简化,并且训练时间仅增加 1 到 1.7 倍。
高分辨率的聚焦能力
FFM 在实际应用中也能实现高质量的成像,即使在复杂的散射环境中也能达到接近物理极限的分辨率。
首先,当光波进入散射介质(如雾、烟或生物组织等),聚焦会变得复杂,不过光波在介质中的传播往往保持一定的对称性。
FFM 就利用了这种对称性,通过优化光波的传播路径和相位,以减少散射效应对聚焦的负面影响。
其效果也很显著,图 b 展示了 FFM 与 PSO(粒子群优化)这两种优化方法的对比。
具体来说,实验采用了两种散射介质,一种是随机相位板(Scatterer-I),另一种是透明胶带(Scatterer-II)。
在这两种介质中,FFM 仅经过 25 次设计迭代就实现了收敛(更快找到优化解),收敛损失值分别为 1.84 和 2.07(越低性能越好)。
而 PSO 方法需要至少 400 次设计迭代才能达到收敛,且在最终收敛时的损失值为 2.01 和 2.15。
同时,图 c 展示了 FFM 能够不断自我优化,它设计的焦点从最初的随机分布逐渐演化和收敛到一个紧密的焦点。
在 3.2 mm × 3.2 mm 的设计区域内,研究人员进一步对 FFM 和 PSO 优化的焦点进行了均匀采样,并比较了它们的 FWHM(半峰全宽)和 PSNR(峰值信噪比)。
结果显示,FFM 聚焦精度更高,成像质量更好。
图 e 进一步评估了设计的焦点阵列在扫描位于散射介质后面的分辨率图时的性能。
结果令人惊喜,FFM 设计的焦点尺寸接近 64.5 m 的衍射极限,这是光学成像理论上的最高分辨率标准。
能够并行成像视线之外的物体
既然在散射介质中如此厉害,研究人员又尝试了非视距(NLOS)场景,即物体被隐藏在视线之外的地方。
FFM 利用了从隐藏物体到观察者之间光路的空间对称性,这允许系统通过全光学的方式在现场重建和分析动态隐藏物体。
通过设计输入波前,FFM 能够同时将物体中的所有网格投影到它们的目标位置,实现隐藏物体的并行恢复。
实验中使用了字母形状的隐藏铬靶 "T"、"H" 和 "U",并设置了曝光时间(1 毫秒)和光功率(0.20 mW),以实现对这些动态目标的快速成像。
结果显示,没有 FFM 设计的波前,图像会严重扭曲。而 FFM 设计的波前能够恢复所有三个字母的形状,SSIM(结构相似性指数)达到 1.0,表明与原始图像的高度相似性。
进一步,与人工神经网络(ANN)在光子效率和分类性能方面相比,FFM 显著优于 ANN,尤其是在低光子条件下。
具体而言,在光子数量受限的情况下(如许多反射或高度漫射的表面),FFM 能够自适应地纠正波前畸变,并需要更少的光子来进行准确分类。
在非 Hermitian 系统中自动搜索异常点
FFM 方法不仅适用于自由空间光学系统,还可以扩展到集成光子系统的自我设计。
研究人员使用串联和并联配置的对称光子核心,构建了一个集成神经网络(a)。
实验中,对称核心通过不同水平的注入电流配置了可变光衰减器(VOA),实现了不同的衰减系数,以模拟不同的权重。
在图 c 中,对称核心中编程矩阵值的保真度非常高,时间漂移的标准偏差分别为 0.012%,0.012% 和 0.010%,表明矩阵值非常稳定。
并且,研究人员可视化了每层的误差。对比实验梯度与理论模拟值,其平均偏差为 3.5%。
在大约100 次迭代(epoch)后,网络达到了收敛状态。
实验结果显示,在三种不同的对称比例配置下(1.0、0.75 或 0.5),网络的分类准确度分别为 94.7%、89.2% 和 89.0%。
而使用 FFM 方法的神经网络,得到的分类准确度为 94.2%、89.2% 和 88.7%。
相比之下,如果使用传统的计算机模拟方法来设计网络,实验的分类准确度会低一些,分别为 71.7%、65.8% 和 55.0%。
最后,研究人员还展示了 FFM 可以自我设计非厄米特系统,通过数值模拟,无需物理模型即可实现对特异点的遍历。
非厄米特系统是物理学中的一个概念,它涉及到量子力学和光学等领域中的系统,这些系统不满足厄米特性(Hermitian)条件。
厄米特性与系统的对称性和能量的实数性有关,非厄米特系统则不满足这些条件,它们可能具有一些特殊的物理现象,比如特异点(Exceptional Points),这是系统的动力学行为在某些点上会发生奇异变化的地方。
总结全文,FFM 是一种在物理系统上实现计算密集型训练过程的方法,能够高效并行执行大多数机器学习操作。
更多详细实验设置、数据集准备过程,欢迎查阅原文。
代码:
https://zenodo.org/records/10820584
《Nature》原文:
https://www.nature.com/articles/s41586-024-07687-4
以上是清华光学 AI 登 Nature!物理神经网络,反向传播不需要了的详细内容。更多信息请关注PHP中文网其他相关文章!

热AI工具

Undresser.AI Undress
人工智能驱动的应用程序,用于创建逼真的裸体照片

AI Clothes Remover
用于从照片中去除衣服的在线人工智能工具。

Undress AI Tool
免费脱衣服图片

Clothoff.io
AI脱衣机

Video Face Swap
使用我们完全免费的人工智能换脸工具轻松在任何视频中换脸!

热门文章

热工具

记事本++7.3.1
好用且免费的代码编辑器

SublimeText3汉化版
中文版,非常好用

禅工作室 13.0.1
功能强大的PHP集成开发环境

Dreamweaver CS6
视觉化网页开发工具

SublimeText3 Mac版
神级代码编辑软件(SublimeText3)

如今的深度学习方法专注于设计最适合的目标函数,以使模型的预测结果与实际情况最接近。同时,必须设计一个合适的架构,以便为预测获取足够的信息。现有方法忽略了一个事实,即当输入数据经过逐层特征提取和空间变换时,大量信息将会丢失。本文将深入探讨数据通过深度网络传输时的重要问题,即信息瓶颈和可逆函数。基于此提出了可编程梯度信息(PGI)的概念,以应对深度网络实现多目标所需的各种变化。PGI可以为目标任务提供完整的输入信息,以计算目标函数,从而获得可靠的梯度信息以更新网络权重。此外设计了一种新的轻量级网络架

在我的世界(Minecraft)中,红石是一种非常重要的物品。它是游戏中的一种独特材料,开关、红石火把和红石块等能对导线或物体提供类似电流的能量。红石电路可以为你建造用于控制或激活其他机械的结构,其本身既可以被设计为用于响应玩家的手动激活,也可以反复输出信号或者响应非玩家引发的变化,如生物移动、物品掉落、植物生长、日夜更替等等。因此,在我的世界中,红石能够控制的机械类别极其多,小到简单机械如自动门、光开关和频闪电源,大到占地巨大的电梯、自动农场、小游戏平台甚至游戏内建的计算机。近日,B站UP主@

在苹果的iPhone15Pro机型上,主摄像头现在允许用户在拍摄时在三个焦距之间切换。继续阅读以了解其工作原理。为了充分利用iPhone15Pro和iPhone15ProMax上的增强型摄像头系统,苹果为主摄像头的光学变焦添加了三个流行的焦距选项。有默认的24mm(相当于1倍光学变焦)、28毫米(1.2倍光学变焦)和35mm(1.5倍光学变焦)。Apple通过使用计算处理来裁剪新的更大传感器可以捕获的48万像素图像,从而将这些特定的焦距提供给摄影爱好者,因此结果始终提供高分辨率的24MP图像。您

在苹果的iPhone15Pro机型上,用户在主摄像头上拍摄时可以在三个预设的相机焦距之间切换。本文介绍了它们是什么以及如何在iPhone上启用或禁用它们。为了充分利用iPhone15Pro和iPhone15ProMax上的增强型摄像头系统,苹果为主摄像头的光学变焦添加了三个流行的焦距选项。有默认的24mm(相当于1倍光学变焦)、28毫米(1.2倍光学变焦)和35mm(1.5倍光学变焦)。Apple通过使用计算处理来转换新的更大传感器可以捕获的48万像素图像,从而将这些特定的焦距提供给摄影爱好者,

将虚拟机器(VM)转换为物理机器是一种将虚拟实例和关联的应用软件迁移到物理硬件平台的过程。这种转换有助于优化操作系统的性能和硬件资源利用。本文旨在深入探讨如何进行这种转换。如何实现从虚拟机到物理机的迁移?通常,虚拟机与物理机之间的转换过程由第三方软件在虚拟机外部执行。这个过程包括多个阶段,涉及虚拟机的配置和资源转移。准备物理机器:第一步是确保物理机满足Windows的硬件要求。我们需要在物理机上备份数据,因为转换过程将覆盖现有数据。*管理员帐户的用户名和密码,具有创建系统映像的管理员权限。将虚拟

清华镜像源使用攻略:让你的软件安装更畅快,需要具体代码示例在日常使用电脑的过程中,我们经常需要安装各种软件来满足不同的需求。不过,在安装软件时,我们常常会遇到下载速度慢、无法连接等问题,尤其是在使用国外镜像源的时候。为了解决这个问题,清华大学提供了一个镜像源,它提供了丰富的软件资源,并且下载速度非常快。下面,就让我们一起来了解一下清华镜像源的使用攻略。首先,

面向视觉任务(如图像分类)的深度学习模型,通常用来自单一视觉域(如自然图像或计算机生成的图像)的数据进行端到端的训练。一般情况下,一个为多个领域完成视觉任务的应用程序需要为每个单独的领域建立多个模型,分别独立训练,不同领域之间不共享数据,在推理时,每个模型将处理特定领域的输入数据。即使是面向不同领域,这些模型之间的早期层的有些特征都是相似的,所以,对这些模型进行联合训练的效率更高。这能减少延迟和功耗,降低存储每个模型参数的内存成本,这种方法被称为多领域学习(MDL)。此外,MDL模型也可以优于单

论文地址:https://arxiv.org/abs/2307.09283代码地址:https://github.com/THU-MIG/RepViTRepViT在移动端ViT架构中表现出色,展现出显着的优势。接下来,我们将探讨本研究的贡献所在。文中提到,轻量级ViTs通常比轻量级CNNs在视觉任务上表现得更好,这主要归功于它们的多头自注意力模块(MSHA)可以让模型学习全局表示。然而,轻量级ViTs和轻量级CNNs之间的架构差异尚未得到充分研究。在这项研究中,作者们通过整合轻量级ViTs的有效
