Fresnel变换的详解
引言:光波衍射的数学描述
Fresnel变换是波动光学中描述近场衍射现象的核心数学工具,它以法国物理学家Augustin-Jean Fresnel(1788-1827)的名字命名。在现代光学工程中,从激光束传播到全息成像,从半导体光刻到自由空间光通信,Fresnel变换都扮演着不可或缺的角色。这个变换不仅是一个数学公式,更是连接波动光学与几何光学、经典物理与量子力学的重要桥梁。
Fresnel在1818年提交了他著名的"光的衍射理论"论文,该论文为波动光学奠定了数学基础。他的工作统一了惠更斯原理和杨氏干涉定律,建立了定量描述衍射现象的数学框架。1819年,他凭借这项工作获得了法国科学院大奖。评审委员会成员之一泊松最初试图通过预测圆盘阴影中心会出现亮斑来反驳Fresnel的理论,认为这是荒谬的结果,但阿拉戈随后的实验证实了这一预测,这个"泊松亮斑"反而成为波动光学的重要验证。
Fresnel变换的定义和数学表达式
Fresnel衍射积分在傍轴近似条件下描述了光场从源平面到观察平面的传播。完整的二维Fresnel变换表达式为:
$$U(x, y, z) \approx \frac{e^{ikz}}{i\lambda z} \iint_{-\infty}^{\infty} U_0(x', y') \exp\left[\frac{ik}{2z}\left[(x-x')^2 + (y-y')^2\right]\right] dx' dy'$$
这个积分公式中,$U_0(x', y')$表示在源平面($z=0$处)的光场分布,$k = 2\pi/\lambda$是波数,$\lambda$是光波长,$z$是传播距离,$i$是虚数单位。指数项中的二次相位因子$\exp[ik(x-x')^2/(2z)]$是Fresnel变换的关键特征,它区别于远场的Fraunhofer衍射。
通过展开二次项$(x-x')^2 + (y-y')^2 = x^2 + x'^2 - 2xx' + y^2 + y'^2 - 2yy'$,可以将Fresnel积分改写为傅里叶变换的形式:
$$U(x, y, z) = \frac{e^{ikz} e^{ik(x^2+y^2)/(2z)}}{i\lambda z} \iint U_0(x', y') e^{ik(x'^2+y'^2)/(2z)} e^{-ik(xx'+yy')/z} dx' dy'$$
这可以进一步表示为:
$$U(x, y, z) = \frac{e^{ikz} e^{ik(x^2+y^2)/(2z)}}{i\lambda z} \mathcal{F}\left\{U_0(x', y') e^{ik(x'^2+y'^2)/(2z)}\right\}\left(\frac{x}{\lambda z}, \frac{y}{\lambda z}\right)$$
其中$\mathcal{F}$表示二维傅里叶变换。这个表达式揭示了Fresnel变换的本质:它是对源场乘以二次相位因子(Fresnel传播子)后进行的傅里叶变换。
对于具有某种对称性的问题,一维Fresnel变换形式为:
$$U(x, z) \approx \frac{e^{ikz}}{\sqrt{i\lambda z}} \int_{-\infty}^{\infty} U_0(x') \exp\left[\frac{ik(x-x')^2}{2z}\right] dx'$$
Fresnel变换还可以表示为卷积形式。如果定义自由空间传播的冲激响应(点扩散函数)为:
$$h(x, y, z) = \frac{e^{ikz}}{i\lambda z} \exp\left[\frac{ik(x^2 + y^2)}{2z}\right]$$
那么光场传播可以写成:
$$U(x, y, z) = U_0(x, y) * h(x, y, z)$$
其中$*$表示二维卷积运算。这种表示方法将光的传播视为线性滤波过程,传播算子$h(x,y,z)$充当了传递函数的角色。
从线性正则变换(Linear Canonical Transform)的框架来看,Fresnel变换是ABCD矩阵为$\begin{bmatrix} 1 & \lambda z \ 0 & 1 \end{bmatrix}$的特殊情况,它在相空间中代表一个剪切操作,而傅里叶变换对应旋转操作,分数傅里叶变换则对应分数旋转。
Fresnel变换的物理意义和应用背景
要理解Fresnel变换的物理意义,需要从光波的传播本质出发。光波从孔径或障碍物传播时,不能简单地用几何光学的直线传播来描述,而必须考虑波的衍射效应。Fresnel变换描述的是波前曲率不能忽略的近场传播区域。
在波动光学中,惠更斯-菲涅耳原理提供了直观的物理图像:波前上的每一点都可以看作是新的球面子波源,这些子波相互干涉形成新的波前。数学上,这个原理可以表述为:
$$f_\omega(r) = C \iint_{\text{孔径}} f_\omega(r') \frac{e^{ikR}}{R} K(\chi) d^2r'$$
其中$R$是源点$r'$到观察点$r$的距离,$K(\chi)$是倾斜因子,考虑了方向依赖性。Fresnel在1816-1819年的工作将这个直观原理转化为定量的数学理论。基尔霍夫在1882年从波动方程严格推导出这个积分定理,为Fresnel的直观假设提供了坚实的数学基础。
Fresnel变换所描述的近场衍射与远场的Fraunhofer衍射有本质区别。这种区别可以用Fresnel数来量化:
$$F = \frac{a^2}{\lambda z}$$
其中$a$是孔径的特征尺寸。当$F \gg 1$时,处于Fresnel近场衍射区域;当$F \ll 1$时,进入Fraunhofer远场区域。在Fresnel区域,波前是弯曲的球面波,不同孔径点对观察点的贡献具有非恒定的相位差;而在Fraunhofer区域,波前近似为平面波,相位差接近线性关系。
从实际数值来看,对于直径$D = 1$毫米的圆孔和波长$\lambda = 550$纳米的绿光,Fresnel近似在传播距离$z > 0.3$米时有效,而Fraunhofer近似则需要$z > 2$米才成立。这说明在很多实际光学系统中,我们处于Fresnel区域而非Fraunhofer区域。
Fresnel变换的物理应用背景极为广泛。在激光系统中,高斯光束是傍轴波动方程的自然解,而傍轴波动方程正是直接从Fresnel近似导出的。高斯光束在传播过程中保持高斯形状,其束腰半径随传播距离的演化关系为:
$$w(z) = w_0\sqrt{1 + \left(\frac{z}{z_R}\right)^2}$$
其中$w_0$是束腰半径,$z_R = \pi w_0^2 n/\lambda$是瑞利长度,表示光束面积加倍所需的传播距离。这完全是衍射效应的结果,瑞利长度的概念直接源于Fresnel衍射理论。
在光学谐振腔设计中,Fresnel衍射决定了谐振模式的形成。谐振腔的稳定性分析、模式体积计算、衍射损耗评估都依赖于Fresnel数。谐振腔的Fresnel数越小,衍射效应越显著,高阶模式经历更强的衍射损耗,有利于基模运转。
与傅里叶变换的关系和数学推导
Fresnel变换与傅里叶变换之间存在着数学联系。要理解这种关系,最好从精确的Rayleigh-Sommerfeld衍射积分出发,通过系统的近似过程推导Fresnel变换,并阐明它如何在远场极限下过渡到纯粹的傅里叶变换。
Rayleigh-Sommerfeld衍射积分是标量衍射理论的精确出发点。它表明,给定$z=0$平面的场分布后,空间任意点$(x, y, z)$的场可以表示为:
$$U(x, y, z) = \frac{1}{i\lambda} \iint U_0(x', y') \frac{z e^{ikr}}{r^2} dx' dy'$$
其中$r = \sqrt{(x-x')^2 + (y-y')^2 + z^2}$是源点到观察点的距离,因子$z/r$是倾斜因子,它确保子波主要向前传播。这个积分精确地实现了惠更斯-菲涅耳原理。
第一步:傍轴近似。当传播距离$z$远大于横向尺度且光线与光轴夹角很小时,可以在分母中近似$r \approx z$,这样得到:
$$U(x, y, z) \approx \frac{1}{i\lambda z} \iint U_0(x', y') e^{ikr} dx' dy'$$
但在指数项$e^{ikr}$中不能简单地用$r \approx z$,因为波数$k \approx 10^7 \, \text{m}^{-1}$对于可见光而言非常大,即使$r$的微小误差也会被$k$放大,导致相位完全错误。
第二步:Fresnel相位近似。对距离$r$进行泰勒展开:
$$r = \sqrt{(x-x')^2 + (y-y')^2 + z^2} = z\sqrt{1 + \frac{(x-x')^2 + (y-y')^2}{z^2}}$$
使用二项式展开$\sqrt{1+\epsilon} \approx 1 + \epsilon/2 - \epsilon^2/8 + \cdots$,在$\epsilon = [(x-x')^2 + (y-y')^2]/z^2$较小时,保留到二阶项:
$$r \approx z + \frac{(x-x')^2 + (y-y')^2}{2z}$$
这就是Fresnel近似,也称为抛物面近似,因为它将真实的球面波前用抛物面来近似。将这个近似代入Rayleigh-Sommerfeld积分,得到完整的Fresnel衍射积分:
$$U(x, y, z) \approx \frac{e^{ikz}}{i\lambda z} \iint U_0(x', y') \exp\left\{\frac{ik[(x-x')^2 + (y-y')^2]}{2z}\right\} dx' dy'$$
展开二次项$(x-x')^2 + (y-y')^2 = x^2 + x'^2 - 2xx' + y^2 + y'^2 - 2yy'$后,可以将相位因子分离:
$$U(x, y, z) = \frac{e^{ikz} e^{ik(x^2+y^2)/(2z)}}{i\lambda z} \iint U_0(x', y') e^{ik(x'^2+y'^2)/(2z)} e^{-2\pi i(xx'+yy')/(\lambda z)} dx' dy'$$
最后的指数项$e^{-2\pi i(xx'+yy')/(\lambda z)}$正是傅里叶变换的核函数。因此,Fresnel变换本质上是对源场乘以二次相位因子$\exp[ik(x'^2+y'^2)/(2z)]$后进行的傅里叶变换。积分外的二次相位因子$\exp[ik(x^2+y^2)/(2z)]$不影响强度分布,因为$|e^{i\phi}|^2 = 1$。
Fresnel近似的有效性条件要求泰勒展开的三阶项可以忽略。三阶项为:
$$\frac{z}{8} \cdot \frac{[(x-x')^2 + (y-y')^2]^2}{z^4}$$
这一项必须远小于一个波长对应的相位$2\pi$,即:
$$\frac{k[(x-x')^2 + (y-y')^2]^2}{8z^3} \ll 2\pi$$
对于孔径直径为$D$的系统,这可以简化为:
$$\frac{z}{\lambda} > \left(\frac{D}{\lambda}\right)^{4/3}$$
例如,对于$D = 1$毫米、$\lambda = 550$纳米的情况,$(D/\lambda)^{4/3} \approx 10^4$,因此Fresnel近似在$z > 5.5$毫米时有效。
第三步:Fraunhofer近似和纯傅里叶变换。当传播距离进一步增大时,可以忽略物坐标$x'$、$y'$上的二次相位项。从Fresnel积分出发,如果满足:
$$\frac{k(x'^2 + y'^2)}{2z} \ll \pi$$
或等价地:
$$\frac{z}{\lambda} > \left(\frac{D}{\lambda}\right)^2$$
那么可以近似$\exp[ik(x'^2+y'^2)/(2z)] \approx 1$,这样得到Fraunhofer衍射积分:
$$U(x, y, z) \approx \frac{e^{ikz} e^{ik(x^2+y^2)/(2z)}}{i\lambda z} \mathcal{F}\{U_0(x', y')\}\left(\frac{x}{\lambda z}, \frac{y}{\lambda z}\right)$$
这表明Fraunhofer远场衍射图样就是孔径场$U_0(x', y')$的傅里叶变换(加上一个不影响强度的二次相位因子)。这是衍射理论中最优美的结果之一:在远场,复杂的波动传播简化为简单的傅里叶变换关系。
从数学角度看,近似层次为:Rayleigh-Sommerfeld(精确)→ Fresnel(傍轴)→ Fraunhofer(远场/傅里叶变换)。每一步近似都放宽了对传播距离的要求,但精度逐渐降低。
二次相位因子的物理意义值得特别强调。在Fresnel变换中,物面上的二次相位因子$\exp[ik(x'^2+y'^2)/(2z)]$代表了球面波前的曲率,它无法从积分中分离出来,导致衍射图样随传播距离$z$而变化。观察面上的二次相位因子$\exp[ik(x^2+y^2)/(2z)]$同样代表传播球面波的相位,但它不影响强度。在远场Fraunhofer区域,物面的二次相位因子趋于常数1,这意味着从物的角度看,球面波已经足够接近平面波,因此衍射图样的形状不再随距离变化,只是尺度缩放。
角谱方法提供了另一个视角来理解Fresnel变换与傅里叶变换的关系。任意场分布$U_0(x, y)$可以分解为平面波的叠加,通过二维傅里叶变换实现:
$$U_0(x, y) = \iint \mathcal{F}\{U_0\}(k_x/(2\pi), k_y/(2\pi)) e^{i(k_x x + k_y y)} dk_x dk_y$$
每个平面波分量在传播距离$z$后获得相位因子$\exp(ik_z z)$,其中纵向波矢为:
$$k_z = \sqrt{k^2 - k_x^2 - k_y^2}$$
Fresnel近似在波矢空间对应于$k_z$的抛物线展开:
$$k_z \approx k - \frac{k_x^2 + k_y^2}{2k}$$
这正是傍轴近似在$k$空间的表现。这种联系揭示了Fresnel变换在相空间(时频域)中对应于剪切操作,而傅里叶变换对应于旋转操作,这一认识在线性正则变换理论框架下得到统一。
数值计算方法和实现
尽管Fresnel变换有优美的解析形式,但对于复杂的孔径形状和实际光学系统,解析求解通常不可行,必须借助数值计算方法。现代数值算法使得实时模拟和优化成为可能,极大地推动了计算光学的发展。
基于快速傅里叶变换(FFT)的方法是计算Fresnel变换最常用的技术。由于Fresnel变换可以表示为傅里叶变换加上二次相位因子,标准的实现步骤为:首先将输入场乘以二次相位因子$\exp[ik(x'^2+y'^2)/(2z)]$,然后进行二维FFT,最后乘以传播相位因子。计算复杂度从直接积分的$O(N^4)$降低到$O(N^2 \log N)$,其中$N$是每个维度的采样点数。对于$N = 1024$的典型情况,FFT方法快约$10^5$倍。但FFT方法需要满足采样条件,特别是传播距离必须满足$z \leq N(\Delta x)^2/\lambda$(Nyquist准则),其中$\Delta x$是像素尺寸。
角谱方法(Angular Spectrum Method, ASM)提供了另一种FFT加速的计算途径。它将场分解为平面波的角谱,每个平面波分量独立传播,获得相位因子$\exp(ik_z z)$,其中$k_z = \sqrt{k^2 - k_x^2 - k_y^2}$。角谱方法在短传播距离时比传递函数方法更准确,并且不需要傍轴近似,可以处理大角度传播。带限角谱方法通过滤除高空间频率防止混叠,提高了数值稳定性。
直接积分方法(FFT-DI)实现Rayleigh-Sommerfeld衍射积分,使用Simpson规则提高计算精度。对于近场计算,直接积分方法在某些距离范围内比Fresnel近似更准确。沈峰和王晓的2006年研究比较了不同方法的精度,发现对于特定参数范围,直接积分方法是最佳选择。
移位Fresnel衍射算法允许源平面和观察平面使用不同的采样率,可以设置任意的放大或缩小比例,解决了短传播距离时的混叠问题。Shimobaba等人在2013年的研究详细分析了混叠条件,提出了尺度和移位操作来减少混叠伪影。
卷积方法通过FFT加速的卷积运算评估Fresnel-Kirchhoff积分,对于光子筛和复杂孔径特别有效。相比直接的s-FFT方法,卷积方法计算时间更短且保持相同精度,在光子筛聚焦、衍射光学元件设计等应用中表现出色。
分数傅里叶变换(Fractional Fourier Transform, FRT)为Fresnel衍射提供了统一框架,涵盖从物面到Fraunhofer域的所有传播区域。通过单步算法计算分数傅里叶变换,可以覆盖所有Fresnel衍射区制。s-FFT方法直接评估分数傅里叶变换积分,Fresnel图样与FRT图样之间的关系使得快速计算成为可能。
附录:Fresnel变换
A1. 从Maxwell方程组到标量波动方程
电磁场的传播由Maxwell方程组描述。在无源、均匀、各向同性介质中,Maxwell方程组可以化简为:
$$\nabla \times \mathbf{E} = -\frac{\partial \mathbf{B}}{\partial t}$$
$$\nabla \times \mathbf{H} = \frac{\partial \mathbf{D}}{\partial t}$$
$$\nabla \cdot \mathbf{D} = 0$$
$$\nabla \cdot \mathbf{B} = 0$$
其中$\mathbf{D} = \epsilon \mathbf{E}$,$\mathbf{B} = \mu \mathbf{H}$。对第一个方程取旋度,利用矢量恒等式$\nabla \times (\nabla \times \mathbf{E}) = \nabla(\nabla \cdot \mathbf{E}) - \nabla^2\mathbf{E}$,并注意到$\nabla \cdot \mathbf{E} = 0$,得到:
$$\nabla^2\mathbf{E} - \mu\epsilon \frac{\partial^2 \mathbf{E}}{\partial t^2} = 0$$
这是矢量波动方程。对于单色场$\mathbf{E}(\mathbf{r}, t) = \mathbf{E}(\mathbf{r})e^{-i\omega t}$,时间导数变为$\partial^2/\partial t^2 = -\omega^2$,于是:
$$\nabla^2\mathbf{E} + k^2\mathbf{E} = 0$$
其中$k = \omega\sqrt{\mu\epsilon} = 2\pi/\lambda$是波数。
在许多情况下,特别是当偏振态不变或可以忽略矢量特性时,可以用标量波动方程描述光场:
$$\nabla^2 U + k^2 U = 0$$
这就是Helmholtz方程,它是Fresnel衍射理论的出发点。
A2. Green函数方法与Kirchhoff衍射积分
为了求解Helmholtz方程的边值问题,引入Green函数$G(\mathbf{r}, \mathbf{r}')$,它满足:
$$\nabla^2 G + k^2 G = -\delta(\mathbf{r} - \mathbf{r}')$$
物理上,Green函数表示位于$\mathbf{r}'$的单位点源在$\mathbf{r}$处产生的场。自由空间的Green函数为:
$$G(\mathbf{r}, \mathbf{r}') = \frac{e^{ik|\mathbf{r}-\mathbf{r}'|}}{4\pi|\mathbf{r}-\mathbf{r}'|}$$
应用Green定理,对于封闭曲面$S$内的任意点$P$:
$$U(P) = \iint_S \left[U \frac{\partial G}{\partial n} - G \frac{\partial U}{\partial n}\right] dS$$
其中$\partial/\partial n$表示沿外法向的导数。
Kirchhoff对孔径衍射问题做了如下假设(Kirchhoff边界条件):
- 在孔径内,场及其导数等于入射场
- 在不透明屏上,场及其导数为零
虽然这些假设在数学上不自洽(场和导数不能同时为零),但对于远大于波长的孔径给出了很好的结果。将这些边界条件代入Green定理,得到Kirchhoff衍射积分:
$$U(P) = \frac{1}{i\lambda} \iint_{\text{孔径}} U_0 \frac{e^{ikr}}{r} \cos\theta \, dS$$
其中$\cos\theta = \mathbf{n} \cdot \mathbf{r}/r$是倾斜因子,$r$是孔径点到观察点的距离。
A3. Rayleigh-Sommerfeld衍射理论
Rayleigh和Sommerfeld独立发展了更严格的衍射理论,避免了Kirchhoff边界条件的不自洽问题。他们使用了两种不同的Green函数:
第一类Rayleigh-Sommerfeld积分使用Green函数:
$$G_{\text{RS1}} = \frac{e^{ikr_1}}{4\pi r_1} - \frac{e^{ikr_2}}{4\pi r_2}$$
其中$r_2$是关于孔径平面的镜像点距离。这个Green函数在孔径平面上满足Dirichlet边界条件$G = 0$,给出:
$$U(P) = \frac{1}{i\lambda} \iint_{\text{孔径}} U_0 \frac{z e^{ikr}}{r^2} \left(1 - \frac{1}{ikr}\right) dS$$
第二类Rayleigh-Sommerfeld积分使用Green函数:
$$G_{\text{RS2}} = \frac{e^{ikr_1}}{4\pi r_1} + \frac{e^{ikr_2}}{4\pi r_2}$$
这个Green函数在孔径平面上满足Neumann边界条件$\partial G/\partial n = 0$。
对于典型的光学问题,$kr \gg 1$(距离远大于波长),可以忽略$1/(ikr)$项,第一类Rayleigh-Sommerfeld积分简化为:
$$U(P) = \frac{1}{i\lambda} \iint_{\text{孔径}} U_0 \frac{z e^{ikr}}{r^2} dS$$
这是我们推导Fresnel变换的起点。
A4. 傍轴近似的推导
设孔径在$z = 0$平面,观察点在$(x, y, z)$,孔径上的点为$(x', y', 0)$。距离为:
$$r = \sqrt{(x-x')^2 + (y-y')^2 + z^2}$$
定义横向距离$\rho = \sqrt{(x-x')^2 + (y-y')^2}$,则:
$$r = z\sqrt{1 + \frac{\rho^2}{z^2}} = z\left(1 + \frac{\rho^2}{z^2}\right)^{1/2}$$
使用广义二项式定理展开:
$$(1 + \xi)^{1/2} = \sum_{n=0}^{\infty} \binom{1/2}{n} \xi^n = 1 + \frac{1}{2}\xi - \frac{1}{8}\xi^2 + \frac{1}{16}\xi^3 - \frac{5}{128}\xi^4 + \cdots$$
其中二项式系数为:
$$\binom{1/2}{n} = \frac{(1/2)(1/2-1)(1/2-2)\cdots(1/2-n+1)}{n!}$$
代入$\xi = \rho^2/z^2$:
$$r = z\left[1 + \frac{1}{2}\frac{\rho^2}{z^2} - \frac{1}{8}\frac{\rho^4}{z^4} + \frac{1}{16}\frac{\rho^6}{z^6} - \cdots\right]$$
在相位项$e^{ikr}$中,需要保留足够的精度。相位误差$\Delta\phi = k\Delta r$应远小于$2\pi$。对于第$n$阶项:
$$k \cdot z \cdot \left|\binom{1/2}{n}\right| \left(\frac{\rho_{\max}}{z}\right)^{2n} \ll 2\pi$$
其中$\rho_{\max}$是孔径的最大横向尺寸。
Fresnel近似保留到二阶项:
$$r \approx z + \frac{\rho^2}{2z} = z + \frac{(x-x')^2 + (y-y')^2}{2z}$$
误差主要来自忽略的三阶项:
$$\Delta r_3 = -\frac{z}{8}\left(\frac{\rho}{z}\right)^4 = -\frac{\rho^4}{8z^3}$$
要求$k|\Delta r_3| \ll 2\pi$,即:
$$\frac{k\rho_{\max}^4}{8z^3} \ll 2\pi$$
这给出Fresnel近似的有效条件:
$$z^3 \gg \frac{\rho_{\max}^4}{16\pi\lambda}$$
A5. 分数傅里叶变换与Fresnel变换的统一
分数傅里叶变换(Fractional Fourier Transform, FrFT)定义为:
$$F^{\alpha}[f](u) = \sqrt{\frac{1-i\cot\alpha}{2\pi}} \int_{-\infty}^{\infty} f(x) \exp\left[\frac{i(x^2+u^2)\cot\alpha - 2iux}{2\sin\alpha}\right] dx$$
其中$\alpha$是变换的阶数参数。当$\alpha = \pi/2$时,退化为标准傅里叶变换。
令$\cot\alpha = z/(k\sigma^2)$,其中$\sigma$是特征长度尺度,分数傅里叶变换可以改写为:
$$F^{\alpha}[f](u) = C(\alpha) \int_{-\infty}^{\infty} f(x) \exp\left[\frac{ik(x^2+u^2)}{2z} - \frac{ikxu}{z\sin\alpha}\right] dx$$
比较Fresnel变换:
$$U(x, z) = \frac{e^{ikz}}{i\lambda z} \int_{-\infty}^{\infty} U_0(x') \exp\left[\frac{ik(x-x')^2}{2z}\right] dx'$$
展开后:
$$U(x, z) = \frac{e^{ikz}e^{ikx^2/(2z)}}{i\lambda z} \int_{-\infty}^{\infty} U_0(x') \exp\left[\frac{ikx'^2}{2z} - \frac{ikxx'}{z}\right] dx'$$
可见Fresnel变换是分数傅里叶变换在特定参数下的特例。这种联系揭示了光学传播在相空间中的几何意义:
- 自由空间传播(Fresnel变换)对应相空间中的剪切变换
- 透镜变换对应相空间中的分数旋转
- 完整的傅里叶变换对应$\pi/2$旋转
A6. 角谱传播的推导
任意单色场$U(x, y, z)$可以表示为不同传播方向平面波的叠加。在$z = 0$平面,场的角谱表示为:
$$U(x, y, 0) = \iint_{-\infty}^{\infty} A(k_x, k_y) e^{i(k_x x + k_y y)} dk_x dk_y$$
其中角谱$A(k_x, k_y)$是场的二维傅里叶变换:
$$A(k_x, k_y) = \frac{1}{(2\pi)^2} \iint_{-\infty}^{\infty} U(x, y, 0) e^{-i(k_x x + k_y y)} dx dy$$
每个平面波分量$\exp[i(k_x x + k_y y + k_z z)]$必须满足Helmholtz方程,因此:
$$k_x^2 + k_y^2 + k_z^2 = k^2$$
解得:
$$k_z = \pm\sqrt{k^2 - k_x^2 - k_y^2}$$
对于向前传播的波,选择正根。传播到距离$z$后:
$$U(x, y, z) = \iint_{-\infty}^{\infty} A(k_x, k_y) e^{i(k_x x + k_y y + k_z z)} dk_x dk_y$$
这就是角谱传播公式。传播算子为:
$$H(k_x, k_y; z) = e^{ik_z z} = \exp\left[iz\sqrt{k^2 - k_x^2 - k_y^2}\right]$$
傍轴近似下的角谱:当$k_x^2 + k_y^2 \ll k^2$时,对$k_z$进行泰勒展开:
$$k_z = k\sqrt{1 - \frac{k_x^2 + k_y^2}{k^2}} \approx k - \frac{k_x^2 + k_y^2}{2k}$$
传播算子变为:
$$H(k_x, k_y; z) \approx \exp\left[ikz - \frac{iz(k_x^2 + k_y^2)}{2k}\right]$$
在空间域,这对应于卷积:
$$U(x, y, z) = U(x, y, 0) * h(x, y, z)$$
其中脉冲响应为:
$$h(x, y, z) = \mathcal{F}^{-1}\{H(k_x, k_y; z)\} = \frac{e^{ikz}}{i\lambda z} \exp\left[\frac{ik(x^2 + y^2)}{2z}\right]$$
这正是Fresnel传播核。
A7. Talbot效应与离散Fresnel变换
考虑周期为$\Lambda$的无限光栅,其透射函数可以展开为Fourier级数:
$$t(x) = \sum_{n=-\infty}^{\infty} c_n e^{i2\pi nx/\Lambda}$$
经过距离$z$的Fresnel传播后:
$$U(x, z) = \sum_{n=-\infty}^{\infty} c_n e^{i2\pi nx/\Lambda} \exp\left[\frac{ik\Lambda^2n^2}{2z\cdot 4\pi^2}\right]$$
定义Talbot距离$z_T = 2\Lambda^2/\lambda$,则:
$$\exp\left[\frac{ik\Lambda^2n^2}{2z\cdot 4\pi^2}\right] = \exp\left[\frac{i\pi n^2 z}{z_T}\right]$$
当$z = z_T$时,相位因子变为$\exp(i\pi n^2) = (-1)^{n^2} = (-1)^n$(因为$n^2 \equiv n \pmod{2}$),光栅自成像。
当$z = z_T/2$时,相位因子为$\exp(i\pi n^2/2)$,产生横向移位半个周期的像,这就是分数Talbot效应。
对于有限尺寸的周期结构,定义离散Fresnel变换:
$$\text{DFnT}_N\{f\}[m] = \frac{1}{\sqrt{N}} \sum_{n=0}^{N-1} f[n] \exp\left[\frac{2\pi i(m-n)^2}{N}\right]$$
这个变换保持了连续Fresnel变换的主要性质,包括:
- 幺正性:$\text{DFnT}_N^{-1} = \text{DFnT}_N^*$
- 周期性:$\text{DFnT}_N^4 = I$(恒等算子)
- 与DFT的关系:可以通过chirp-z变换快速计算
A8. 高斯光束传播的分析
高斯光束是傍轴波动方程的基本解。设光束沿$z$轴传播,在横向具有高斯分布。傍轴波动方程为:
$$\nabla_\perp^2 U + 2ik\frac{\partial U}{\partial z} = 0$$
其中$\nabla_\perp^2 = \partial^2/\partial x^2 + \partial^2/\partial y^2$是横向拉普拉斯算子。
假设解的形式为:
$$U(x, y, z) = A(z) \exp\left[-\frac{x^2 + y^2}{w^2(z)} + i\phi(x, y, z)\right]$$
其中$w(z)$是束腰半径,$\phi$是相位。代入傍轴方程,要求实部和虚部分别为零,得到:
$$w^2(z) = w_0^2\left[1 + \left(\frac{z}{z_R}\right)^2\right]$$
其中$w_0$是$z = 0$处的束腰半径,$z_R = \pi w_0^2/\lambda$是瑞利长度。
完整的高斯光束解为:
$$U(r, z) = U_0 \frac{w_0}{w(z)} \exp\left[-\frac{r^2}{w^2(z)} - ikz - ik\frac{r^2}{2R(z)} + i\zeta(z)\right]$$
其中:
- $R(z) = z[1 + (z_R/z)^2]$是波前曲率半径
- $\zeta(z) = \arctan(z/z_R)$是Gouy相位
- $r^2 = x^2 + y^2$
q参数方法:引入复光束参数$q(z) = z + iz_R$,则:
$$\frac{1}{q(z)} = \frac{1}{R(z)} - \frac{i\lambda}{\pi w^2(z)}$$
光束通过光学系统的变换遵循ABCD矩阵法则:
$$q_2 = \frac{Aq_1 + B}{Cq_1 + D}$$
A9. 矢量衍射理论与标量近似的有效性
严格的电磁场衍射需要考虑矢量特性。从矢量波动方程出发:
$$\nabla^2\mathbf{E} + k^2\mathbf{E} = 0$$
在笛卡尔坐标系中,每个分量满足标量Helmholtz方程,但边界条件将它们耦合。
Debye-Wolf理论:对于高数值孔径系统,需要考虑偏振效应。聚焦场为:
$$\mathbf{E}(r, \phi, z) = -\frac{ikf}{2\pi} \int_0^{\alpha_{\max}} \int_0^{2\pi} \mathbf{E}_0(\theta, \phi) \sqrt{\cos\theta} e^{ikr\sin\theta\cos(\phi-\phi')} e^{ikz\cos\theta} \sin\theta d\theta d\phi$$
其中$\alpha_{\max}$是最大会聚角,$f$是焦距。
标量近似的有效条件:
- 孔径远大于波长:$D \gg \lambda$
- 观察距离不太近:$z > D^2/\lambda$(避免近场倏逝波)
- 偏振态均匀或缓变
- 傍轴条件:$\theta_{\max} \ll 1$弧度
当这些条件满足时,标量Fresnel理论的误差通常小于1%。
A10. 相干性与部分相干光的Fresnel传播
对于部分相干光,需要使用互相干函数$\Gamma(x_1, y_1; x_2, y_2)$描述:
$$\Gamma(x_1, y_1; x_2, y_2) = \langle U^*(x_1, y_1)U(x_2, y_2) \rangle$$
其中$\langle \cdot \rangle$表示系综平均。
通过Fresnel传播后,互相干函数变为:
$$\Gamma_z(x_1, y_1; x_2, y_2) = \iint \iint \Gamma_0(x_1', y_1'; x_2', y_2') K^*(x_1, y_1; x_1', y_1') K(x_2, y_2; x_2', y_2') dx_1' dy_1' dx_2' dy_2'$$
其中$K$是Fresnel传播核。
对于空间相干性较低的光源(如LED、太阳光),可以使用准均匀光近似:
$$\Gamma_0(x_1', y_1'; x_2', y_2') = I(x', y') \mu(x_1' - x_2', y_1' - y_2')$$
其中$I$是强度分布,$\mu$是复相干度。
Van Cittert-Zernike定理:非相干光源经过Fresnel传播后,远场的空间相干性由光源强度分布的傅里叶变换决定:
$$\mu(x_1 - x_2, y_1 - y_2) \propto \mathcal{F}\{I(x', y')\}\left(\frac{x_1 - x_2}{\lambda z}, \frac{y_1 - y_2}{\lambda z}\right)$$
这解释了为什么小光源(如恒星)产生高相干性,而扩展光源产生低相干性。
A11. 非线性介质中的Fresnel传播
在非线性光学中,高强度光束会引起折射率的强度依赖变化:
$$n = n_0 + n_2 I$$
其中$n_2$是非线性折射率系数。修改后的传播方程为:
$$\nabla_\perp^2 U + 2ik\frac{\partial U}{\partial z} + 2k^2\frac{n_2}{n_0}|U|^2 U = 0$$
这是非线性薛定谔方程(NLSE)。对于弱非线性,可以用分步傅里叶方法求解:
- 线性步:应用Fresnel传播算子
- 非线性步:应用非线性相位$\exp[ik n_2 |U|^2 \Delta z / n_0]$
这种方法广泛应用于:
- 光纤中的孤子传播
- 激光束的自聚焦
- 光学克尔效应
- 四波混频过程