正交时频空间调制(OTFS)技术详解:基础原理与未来挑战
Wei Z, Li S, Yuan W, et al. Orthogonal time frequency space modulation—Part I: Fundamentals and challenges ahead[J]. IEEE Communications Letters, 2022, 27(1): 4-8.
引言:高速移动通信的新需求与技术背景
随着无线通信技术的快速发展,下一代无线网络面临着前所未有的挑战。这些网络需要支持越来越多样化的应用场景,包括飞机上的移动通信(MCA)、低地球轨道(LEO)卫星通信、高速列车通信系统、无人机(UAV)网络以及车对车(V2V)通信网络。这些应用场景的共同特点是存在高速相对运动,导致无线信道呈现快速时变特性,这主要是由多普勒效应引起的。
在高移动性传播环境中,如果系统设计时没有充分考虑多普勒效应,无线通信性能将会严重恶化。让我们通过一个具体的例子来理解这个问题的严重性。考虑一个工作在载频 $f_c = 3.5$ GHz 的OFDM系统,采用子载波间隔 $\Delta f = 15$ kHz,需要支持相对速度 $v = 300$ km/h 的移动通信。在这种情况下,最大多普勒频移为:
$$\nu_{max} = \frac{v \cdot f_c}{c} = \frac{300/3.6 \times 3.5 \times 10^9}{3 \times 10^8} = 972.22 \text{ Hz}$$
包含20%循环前缀的OFDM符号持续时间为 $T_{symbol} = 80$ ms。根据通信理论,信道的相干时间可以估算为:
$$T_{coherence} = \frac{1}{4\nu_{max}} = \frac{1}{4 \times 972.22} = 257.14 \text{ ms}$$
这意味着在一个相干时间区间内最多只能容纳 $\lfloor 257.14/80 \rfloor = 3$ 个OFDM符号。换句话说,每传输3个OFDM符号就需要插入一个导频符号进行信道估计,这将导致至少33%的导频开销,严重降低了系统的频谱效率。
正是在这样的技术背景下,正交时频空间(OTFS)调制作为一种革命性的新型波形被提出。与传统的OFDM在时频(TF)域放置信息符号不同,OTFS将信息符号放置在延迟-多普勒(DD)域中。这个看似简单的改变带来了根本性的优势:在DD域中,即使是快速时变的无线信道也呈现出准静态和稀疏的特性。这是因为DD域直接反映了散射体的物理特性——只有当散射体的位置或速度发生剧烈变化时,DD域信道响应才会改变。
OTFS调制的两种主要实现架构
OTFS调制主要有两种实现架构:基于辛有限傅里叶变换(SFFT)的方法和基于离散Zak变换(DZT)的方法。这两种方法虽然在实现细节上有所不同,但在某些条件下可以得到相同的输入输出关系。
基于辛有限傅里叶变换(SFFT)的OTFS架构
图1详细描述:SFFT-based OTFS收发机架构
图1展示了完整的SFFT-based OTFS收发机系统框图。该架构可以分为发送端和接收端两个主要部分:
发送端处理流程:
- 输入:DD域信息符号 $X_{DD}[l,k]$ 进入系统
- ISFFT模块:将DD域符号通过逆辛有限傅里叶变换转换到时频域,得到 $X_{TF}[m,n]$
- 多载波调制模块:对时频域信号进行海森堡变换,生成时域发送信号 $s(t)$
- 信道:信号经过具有DD域响应 $h_{DD}(\tau,\nu)$ 的时变信道
接收端处理流程:
- 接收信号:含噪声的接收信号 $r(t)$ 进入接收机
- 多载波解调模块:通过维格纳变换将时域信号转换到时频域,得到 $Y_{TF}[m,n]$
- SFFT模块:将时频域接收信号变换回DD域,得到 $Y_{DD}[l,k]$
- 输出:DD域接收符号用于后续的信道估计和符号检测
图中虚线框标识了OTFS调制和解调的核心部分,展示了其与传统OFDM系统的兼容性——OTFS可以看作在OFDM基础上增加了DD域到时频域的变换。
数学原理详解
在SFFT-based OTFS系统中,假设总带宽 $B{OTFS}$ 和总时间 $T{OTFS}$ 用于传输一个OTFS帧。系统参数配置如下:
- 带宽划分:$M$ 个子载波,子载波间隔 $\Delta f = \frac{B_{OTFS}}{M}$
- 时间划分:$N$ 个时隙,每个时隙持续时间 $T = \frac{T_{OTFS}}{N}$
发送端的信号处理包括两个关键步骤。首先是逆辛有限傅里叶变换(ISFFT),将DD域符号映射到时频域:
$$X_{TF}[m,n] = \frac{1}{\sqrt{NM}}\sum_{k=0}^{N-1}\sum_{l=0}^{M-1}X_{DD}[l,k]e^{j2\pi\left(\frac{nk}{N}-\frac{ml}{M}\right)}$$
这里,指数项 $e^{j2\pi\left(\frac{nk}{N}-\frac{ml}{M}\right)}$ 实现了DD域到时频域的基函数映射。注意到当 $n=0$ 时,该变换退化为关于延迟索引 $l$ 的逆傅里叶变换;当 $m=0$ 时,该变换退化为关于多普勒索引 $k$ 的逆傅里叶变换。
第二步是多载波调制(海森堡变换),将时频域信号转换为时域发送信号:
$$s(t) = \sum_{n=0}^{N-1}\sum_{m=0}^{M-1}X_{TF}[m,n]g_{tx}(t-nT)e^{j2\pi m\Delta f(t-nT)}$$
其中 $g_{tx}(t)$ 是发送端脉冲成形滤波器,它决定了信号在时频域的局部化特性。
信道模型在DD域中具有特别简洁的表示。连续DD域信道响应可以写为:
$$h_{DD}(\tau,\nu) = \sum_{i=1}^{P}h_i\delta(\tau-\tau_i)\delta(\nu-\nu_i)$$
这里每个路径 $i$ 由三个参数完全描述:复数增益 $h_i$、延迟 $\taui \in [0,\tau{max}]$ 和多普勒频移 $\nui \in [-\nu{max},\nu_{max}]$。这种表示的物理意义非常直观——每个散射体贡献一个特定的延迟和多普勒频移。
经过信道传输后,接收信号可以表示为:
$$r(t) = \int_{-\infty}^{\infty}\int_{-\infty}^{\infty}h_{DD}(\tau,\nu)e^{j2\pi\nu(t-\tau)}s(t-\tau)d\tau d\nu + z(t)$$
将信道模型代入,得到:
$$r(t) = \sum_{i=1}^{P}h_is(t-\tau_i)e^{j2\pi\nu_i(t-\tau_i)} + z(t)$$
接收端首先进行多载波解调(维格纳变换):
$$Y_{TF}[m,n] = \int_{-\infty}^{\infty}r(t)g_{rx}^*(t-nT)e^{-j2\pi m\Delta f(t-nT)}dt$$
然后通过SFFT将时频域信号变换回DD域:
$$Y_{DD}[l,k] = \frac{1}{\sqrt{NM}}\sum_{n=0}^{N-1}\sum_{m=0}^{M-1}Y_{TF}[m,n]e^{-j2\pi\left(\frac{kn}{N}-\frac{lm}{M}\right)}$$
基于离散Zak变换(DZT)的OTFS架构
图2详细描述:DZT-based OTFS收发机架构
图2展示了DZT-based OTFS的系统框图,其核心特点是直接在DD域和时域之间进行变换,绕过了时频域:
发送端处理流程:
- 输入:DD域信息符号 $X_{DD}[l,k]$
- IDZT模块:通过逆离散Zak变换直接生成时延域(TD)序列 $x_{TD}[l+nM]$
- DAC模块:数模转换生成连续时间发送信号 $s(t)$
接收端处理流程:
- ADC模块:对接收信号 $r(t)$ 进行模数转换,得到TD域序列 $y_{TD}[l+nM]$
- DZT模块:通过离散Zak变换恢复DD域符号 $Y_{DD}[l,k]$
相比SFFT架构,DZT架构的主要优势在于计算复杂度更低,因为它避免了时频域的中间变换步骤。
DZT的数学定义与性质
离散Zak变换建立了一维序列和二维序列之间的映射关系。对于周期为 $MN$ 的序列 $x$,其离散Zak变换定义为:
$$DZ_x[l,k] = \frac{1}{\sqrt{N}}\sum_{n=0}^{N-1}x[l+nM]e^{-j2\pi\frac{nk}{N}}, \quad l \in \{0,...,M-1\}, k \in \{0,...,N-1\}$$
这个变换具有重要的物理意义:它将时域序列 $x[l+nM]$ 分解为 $M$ 个子序列(由索引 $l$ 标识),然后对每个子序列进行 $N$ 点DFT(由索引 $k$ 标识)。
逆离散Zak变换(IDZT)定义为:
$$x[l+nM] = \frac{1}{\sqrt{N}}\sum_{k=0}^{N-1}DZ_x[l,k]e^{j2\pi\frac{nk}{N}}$$
在OTFS发送端,DD域符号通过IDZT直接生成TD域序列:
$$x_{TD}[l+nM] = \sqrt{M}\sum_{k=0}^{N-1}X_{DD}[l,k]DZ_{g_{tx}}[l,k]e^{j2\pi\frac{nk}{N}}$$
其中 $DZ{g{tx}}[l,k]$ 是发送脉冲成形滤波器的DZT。这个表达式表明,每个DD域符号 $X{DD}[l,k]$ 被调制到对应的DD域基函数 $DZ{g_{tx}}[l,k]$ 上。
两种架构的比较与联系
尽管SFFT和DZT架构在实现方式上有所不同,但它们在特定条件下是等价的。特别是,当采用矩形发送和接收滤波器,且延迟和多普勒频移都是整数时,两种方法得到完全相同的DD域输入输出关系:
$$Y_{DD}[l,k] = \sum_{i=1}^{P}h_iX_{DD}[(l-l_i)_M,(k-k_i)_N]\alpha[l,k,l_i,k_i] + Z_{DD}[l,k]$$
其中下标 $(\cdot)_M$ 和 $(\cdot)_N$ 表示模运算,体现了DD域的周期性。相位项 $\alpha[l,k,l_i,k_i]$ 补偿了循环卷积引起的相位旋转。
两种架构各有优势:
- SFFT架构:与现有OFDM系统兼容性好,便于在时频域进行信号处理(如窗函数设计、多址接入)
- DZT架构:计算复杂度低,仅需要 $N$ 点FFT/IFFT操作,便于在DD域直接进行脉冲设计
延迟-多普勒域的物理意义与数学基础
DD域的概念起源
延迟-多普勒域的概念源于雷达信号处理和无线信道建模。在雷达系统中,目标的距离和速度分别对应于延迟和多普勒参数。类似地,在无线通信中,每个传播路径可以用其延迟(反映传播距离)和多普勒频移(反映相对运动)来表征。
从数学角度看,DD域提供了一种描述线性时变系统的自然框架。考虑一个时变系统,其冲激响应为 $h(t,\tau)$,其中 $t$ 是观察时间,$\tau$ 是延迟。通过对时间变量进行傅里叶变换,我们得到DD域表示:
$$H_{DD}(\tau,\nu) = \int_{-\infty}^{\infty}h(t,\tau)e^{-j2\pi\nu t}dt$$
这个变换揭示了系统的时变特性:$\nu$ 参数量化了系统随时间的变化率。
DD域信息嵌入机制
OTFS调制的核心创新在于直接在DD域嵌入信息。每个DD域信息符号 $X_{DD}[l,k]$ 被调制到一个DD域基函数上,这个基函数在时域表现为时变载波信号。具体而言,位于 $(l_0,k_0)$ 位置的DD域冲激对应的时域信号为:
$$s_{l_0,k_0}(t) = \sum_{n=0}^{N-1}g_{tx}(t-nT)e^{j2\pi m_0\Delta f(t-nT)}e^{j2\pi\frac{nk_0}{N}}$$
这是一个时变脉冲音(pulsetone)信号,其载波频率为 $m_0\Delta f$,相位以速率 $\frac{k_0}{NT}$ 线性变化。
DD域的分辨率与不确定性原理
DD域的分辨率受到海森堡不确定性原理的限制。延迟分辨率和多普勒分辨率之间存在基本的权衡关系:
$$\Delta\tau \cdot \Delta\nu \geq \frac{1}{4\pi}$$
对于OTFS系统,延迟分辨率为 $\Delta\tau = \frac{1}{M\Delta f} = \frac{1}{B{OTFS}}$,多普勒分辨率为 $\Delta\nu = \frac{1}{NT} = \frac{1}{T{OTFS}}$。因此:
$$\Delta\tau \cdot \Delta\nu = \frac{1}{B_{OTFS} \cdot T_{OTFS}} = \frac{1}{MN}$$
这意味着增加帧中的资源元素数量 $MN$ 可以提高DD域的联合分辨率,但延迟和多普勒的单独分辨率仍受到带宽和时间持续的限制。
DD域信道响应与系统模型
离散DD域信道的数学描述
将连续DD域信道离散化到OTFS网格上是一个关键步骤。离散DD域信道响应可以表示为:
$$H_{DD}[l,k,l',k'] = \sum_{i=1}^{P}h_iw(l,k,l',k',l_i,k_i)e^{-j2\pi\nu_i\tau_i}$$
其中 $l_i = \tau_iM\Delta f$ 和 $k_i = \nu_iNT$ 分别是归一化的延迟和多普勒参数。采样函数 $w(l,k,l',k',l_i,k_i)$ 起着至关重要的作用,它描述了连续信道参数如何映射到离散网格上。
对于整数延迟和多普勒($l_i,k_i \in \mathbb{Z}$)以及理想的矩形滤波器,采样函数简化为:
$$w(l,k,l',k',l_i,k_i) = \delta[l-l'-l_i]\delta[k-k'-k_i]$$
这导致了简洁的二维循环卷积输入输出关系。
分数延迟和多普勒的影响
实际系统中,路径延迟和多普勒频移通常不是网格间隔的整数倍,导致分数延迟和分数多普勒问题。在这种情况下,采样函数变得更加复杂:
$$w(l,k,l',k',l_i,k_i) = \frac{1}{NM}\sum_{n=0}^{N-1}\sum_{m=0}^{M-1}\sum_{m'\neq m}^{M-1}A_{g_{tx}g_{rx}}\left(-l_i\frac{1}{M\Delta f},(m-m')\Delta f - k_i\frac{1}{NT}\right) \times$$
$$e^{j2\pi\left[\frac{k'n}{N}+\frac{(ml-m'l'-m'l_i)}{M}-\frac{n(k-k'-k_i)}{N}\right]}$$
这个表达式涉及模糊函数 $A{g{tx}g_{rx}}(\tau,\nu)$,它量化了发送和接收滤波器对不同延迟-多普勒偏移的响应:
$$A_{g_{tx}g_{rx}}(\tau,\nu) = \int_{-\infty}^{\infty}g_{tx}(t)g_{rx}^*(t-\tau)e^{-j2\pi\nu(t-\tau)}dt$$
分数多普勒的存在破坏了DD域的正交性,导致符号间干扰(ISI)和载波间干扰(ICI)。这是OTFS系统设计中的一个主要挑战。
OTFS调制的优势分析
全分集增益的获取
OTFS调制的一个关键优势是每个DD域符号都经历整个时频域信道响应。这可以从输入输出关系中看出——每个发送符号 $X{DD}[l',k']$ 通过信道矩阵 $H{DD}$ 影响所有接收符号。这种二维扩展使得OTFS能够获取时间和频率维度的全部分集增益。
分集增益可以定量分析。对于具有 $L$ 个独立多径的信道,传统OFDM在一个符号周期内只能获取频率分集,分集阶数为 $L$。而OTFS通过 $N$ 个时隙的扩展,理论上可以获得 $NL$ 的分集阶数,显著提高了可靠性。
信道估计开销的降低
在DD域中,信道响应是稀疏的——只有 $P$ 个非零元素,其中 $P \ll MN$。这种稀疏性可以被利用来大幅降低信道估计的导频开销。具体而言,根据压缩感知理论,所需的导频数量大约为:
$$N_{pilot} = O(P\log(MN))$$
相比之下,OFDM系统需要的导频数量与信道长度成正比,在高移动性场景下可能需要频繁的导频插入。
对多普勒扩展的鲁棒性
OTFS的循环卷积结构使其对多普勒扩展具有内在的鲁棒性。多普勒频移在DD域中表现为循环移位,不会破坏符号的正交性(在整数多普勒情况下)。这与OFDM形成鲜明对比,在OFDM中,即使很小的多普勒扩展也会导致严重的ICI。
定量分析表明,对于归一化多普勒扩展 $\nu_{max}T < 0.1$,OFDM的性能急剧下降,而OTFS仍能保持良好的性能。这使得OTFS特别适合于高速移动场景。
实际系统设计考虑
参数选择准则
OTFS系统参数的选择需要综合考虑多个因素:
延迟分辨率要求:
$$l_{max} = \lceil \tau_{max} \cdot B_{OTFS} \rceil$$多普勒分辨率要求:
$$k_{max} = \lceil 2\nu_{max} \cdot T_{OTFS} \rceil$$开销与效率权衡:
$$\eta = \frac{(M-l_{max})(N-k_{max})}{MN}$$
实际设计中,通常选择 $M$ 和 $N$ 使得 $l{max} < M/4$ 和 $k{max} < N/4$,以保证足够的有效数据传输效率。
实现复杂度分析
不同OTFS实现方案的计算复杂度比较:
SFFT方案:
- ISFFT/SFFT: $O(MN\log(MN))$
- 多载波调制/解调: $O(MN)$
- 总复杂度: $O(MN\log(MN))$
DZT方案:
- IDZT/DZT: $O(MN\log N)$
- 总复杂度: $O(MN\log N)$
消息传递检测:
- 每次迭代: $O(PMN)$
- $I$ 次迭代总复杂度: $O(IPMN)$
附录:关键数学
A. 辛有限傅里叶变换的推导
辛有限傅里叶变换(SFFT)源于辛几何和时频分析理论。考虑希尔伯特空间 $L^2(\mathbb{R})$ 上的位移算子:
$$\pi(\lambda)f(t) = e^{j2\pi(\nu t - \tau\nu/2)}f(t-\tau), \quad \lambda = (\tau,\nu) \in \mathbb{R}^2$$
这些算子满足Weyl-Heisenberg群的交换关系:
$$\pi(\lambda_1)\pi(\lambda_2) = e^{j\pi\omega(\lambda_1,\lambda_2)}\pi(\lambda_1+\lambda_2)$$
其中 $\omega(\lambda_1,\lambda_2) = \nu_1\tau_2 - \nu_2\tau_1$ 是辛形式。
对于有限维情况,考虑 $\mathbb{C}^{MN}$ 空间,离散位移算子定义为:
$$\Pi_{l,k}X[m,n] = X[(m-l)_M,(n-k)_N]e^{j2\pi\frac{lk}{MN}}$$
SFFT实际上是这些位移算子的特征值分解。具体而言,对于基向量:
$$\phi_{l,k}[m,n] = \frac{1}{\sqrt{MN}}e^{j2\pi\left(\frac{ml}{M}-\frac{nk}{N}\right)}$$
我们有:
$$\Pi_{l',k'}\phi_{l,k} = e^{j2\pi\left(\frac{ll'}{M}-\frac{kk'}{N}\right)}\phi_{l,k}$$
这表明 $\phi_{l,k}$ 是位移算子的特征向量,SFFT就是向这组特征向量的投影。
B. 循环卷积与相位补偿项的推导
考虑整数延迟 $l_i$ 和整数多普勒 $k_i$ 的情况。DD域基函数经过信道后的变换为:
$$\phi_{l',k'}[m,n] \xrightarrow{\text{channel}} h_ie^{j2\pi\nu_i\tau_i}\phi_{l'-l_i,k'-k_i}[m,n]e^{j2\pi\frac{k_in}{N}}$$
在接收端进行SFFT时:
$$\begin{aligned} Y_{DD}[l,k] &= \frac{1}{\sqrt{MN}}\sum_{m,n}Y_{TF}[m,n]e^{-j2\pi\left(\frac{kn}{N}-\frac{lm}{M}\right)}\\ &= h_iX_{DD}[(l-l_i)_M,(k-k_i)_N]\times\\ &\quad\frac{1}{MN}\sum_{m,n}e^{j2\pi\left[\frac{(l-l_i)m}{M}-\frac{(k-k_i-k_i)n}{N}\right]}e^{-j2\pi\left(\frac{kn}{N}-\frac{lm}{M}\right)} \end{aligned}$$
通过仔细计算求和项,我们得到相位补偿因子:
$$\alpha[l,k,l_i,k_i] = \begin{cases} e^{j2\pi\frac{(l-l_i)Mk_i}{MN}} & l \geq l_i\\ e^{j2\pi\frac{(l-l_i)Mk_i-k_iM-(k-k_i)NM}{MN}} & l < l_i \end{cases}$$
这个相位项的物理意义是补偿循环卷积边界处的相位不连续性。
C. 分数多普勒下的采样函数
当多普勒频移 $\nu_i$ 不是 $\frac{1}{NT}$ 的整数倍时,令 $ki = k{i,int} + k{i,frac}$,其中 $k{i,int} = \lfloor\nuiNT\rfloor$,$k{i,frac} = \nuiNT - k{i,int}$。
此时采样函数变为:
$$w(l,k,l',k',l_i,k_i) = \frac{1}{N}\sum_{n=0}^{N-1}e^{j2\pi n\left(\frac{k-k'-k_{i,int}}{N}-\frac{k_{i,frac}}{N}\right)}$$
当 $k_{i,frac} \neq 0$ 时,这个求和不再是简单的delta函数,而是:
$$w(k,k',k_i) = \frac{\sin(\pi k_{i,frac})}{\sin\left(\pi\left(\frac{k-k'-k_{i,int}}{N}-\frac{k_{i,frac}}{N}\right)\right)}\cdot\frac{1}{N}$$
这导致了符号间的泄漏,即一个发送符号会影响多个接收符号,破坏了正交性。
D. 模糊函数的性质与计算
模糊函数 $A{g{tx}g_{rx}}(\tau,\nu)$ 在OTFS系统分析中起着核心作用。对于常用的矩形脉冲:
$$g_{rect}(t) = \begin{cases} \frac{1}{\sqrt{T}} & 0 \leq t < T\\ 0 & \text{otherwise} \end{cases}$$
其自模糊函数为:
$$A_{rect}(\tau,\nu) = \begin{cases} \left(1-\frac{|\tau|}{T}\right)\text{sinc}\left(\nu(T-|\tau|)\right)e^{-j\pi\nu(T-|\tau|)} & |\tau| < T\\ 0 & |\tau| \geq T \end{cases}$$
这个函数的特性决定了OTFS系统对延迟-多普勒扩展的响应。特别地:
- 主瓣宽度:延迟方向 $2T$,多普勒方向 $\frac{2}{T}$
- 第一零点:$\nu = \frac{1}{T-|\tau|}$
- 峰值旁瓣比:约-13.3 dB
对于根升余弦(RRC)脉冲,模糊函数的计算更为复杂,通常需要数值方法。但RRC脉冲可以提供更好的带外抑制和更低的ISI/ICI。
E. 分集阶数分析
考虑独立同分布瑞利衰落信道,每条路径的增益 $h_i \sim \mathcal{CN}(0,1/P)$。OTFS系统的成对错误概率(PEP)可以通过计算错误事件的欧氏距离来分析。
对于两个不同的DD域符号向量 $\mathbf{X}$ 和 $\hat{\mathbf{X}}$,条件PEP为:
$$P(\mathbf{X} \to \hat{\mathbf{X}}|\mathbf{h}) = Q\left(\sqrt{\frac{||\mathbf{H}(\mathbf{X}-\hat{\mathbf{X}})||^2}{2N_0}}\right)$$
其中 $\mathbf{H}$ 是循环卷积矩阵。通过Chernoff界和矩生成函数方法,平均PEP为:
$$P(\mathbf{X} \to \hat{\mathbf{X}}) \leq \prod_{i=1}^{r}\left(1+\frac{\lambda_i\text{SNR}}{4P}\right)^{-1}$$
其中 $\lambda_i$ 是差分矩阵 $(\mathbf{X}-\hat{\mathbf{X}})(\mathbf{X}-\hat{\mathbf{X}})^H$ 的非零特征值,$r$ 是秩。
在高SNR下,这简化为:
$$P(\mathbf{X} \to \hat{\mathbf{X}}) \approx \left(\frac{4P}{\text{SNR}}\right)^r\prod_{i=1}^{r}\lambda_i^{-1}$$
这表明OTFS可以获得分集阶数 $r$,在最佳情况下 $r = \min(MN,PL)$,其中 $L$ 是每条路径的时延扩展(以采样点计)。
F. 迭代检测算法的收敛性分析
消息传递(MP)算法在OTFS检测中广泛使用。考虑因子图表示,其中变量节点表示DD域符号,因子节点表示观测。消息更新规则为:
$$\mu_{X \to Y}^{(i)}(x) = P(X=x)\prod_{Y' \neq Y}\mu_{Y' \to X}^{(i-1)}(x)$$
$$\mu_{Y \to X}^{(i)}(y) = \sum_{x' \neq x}P(Y|X=x',\mathbf{X}_{-x})\prod_{X' \neq X}\mu_{X' \to Y}^{(i)}(x')$$
收敛性取决于因子图的结构。对于整数延迟和多普勒,因子图是无环的,MP算法保证收敛到精确的边缘后验概率。但对于分数多普勒,因子图包含短环,导致:
- 消息相关性:经过环路传播的消息变得相关
- 收敛性退化:可能收敛到错误的固定点或震荡
- 性能损失:即使收敛,结果可能远离真实后验
改进方法包括阻尼因子、消息调度优化和近似推理技术。