MCMC-1|机器学习推导系列(十五)

简介: MCMC-1|机器学习推导系列(十五)

一、蒙特卡洛方法

(04UY0[$BM6]9}U][`J@~9D.png


这里介绍三种采样方法:


  1. 概率分布采样


首先要求得概率密度函数PDF的累计密度函数CDF,然后求CDF得反函数,在0-1之间均匀取样,代入反函数,就得到了取样点。这个方法的缺点就是大部分PDF很难求得CDF:


@RU3T3(Q4[SZ@QU($]J]QG2.png

                                            概率分布采样


  1. 拒绝采样(Rejection Sampling)

CPFGGT@W3`1FQE0$BYRF9SY.png

重要性采样有⼀个变种 Sampling-Importance-Resampling,这种方法,首先和上面⼀样进行采样,然后在采样出来的N个样本中,重新采样,这个重新采样,使⽤每个样本点的权重作为概率分布进行采样。


二、马尔可夫链


1. 齐次马尔科夫链

5)IL~`0S@@Q}[F3BOB6I}LW.png

2. 转移概率矩阵和状态分布


  • 转移概率矩阵


YN129%W~X~G@AO71THC6MPC.png

  • 状态分布


HEPC4}DGDWORY`T@9MCU`]X.png

其中:

Z480TWQ9G}7C06C_O}]P~AX.png

3. 平稳分布


  • 定义


6NFQ3T98EO5_4BUVSIQ7JS3.png

证明如下:


KFV`9B}Z3~6TR}EQF1]FDHQ.png


这个定理给出了一个求马尔可夫链平稳分布的方法。


4. 连续状态马尔可夫链


  • 概率转移核


连续状态马尔可夫链的转移概率分布由概率转移核或转移核(transition kernel)表示。

EPJXGRSWXJFP9PZNGGDXX)K.png

或简写为:

I@YI)9I(7R(X]6{ZEOZ]Y2O.png

三、马尔可夫链的性质


以下通过离散状态马尔可夫链介绍马尔可夫链的性质,可以推广到连续状态马尔可夫链。


1. 不可约

4YE%5SCTVWZ]YQDJV2QUAKF.png


直观上,一个不可约的马尔可夫链,从任意状态出发,当经过充分长时间后,可以到达任意状态。


举例:


YNU[0BFFGC[]HZT3`@]K23M.png

2. 非周期


在状态空间S中对于任意状态i∈ S,如果时刻0从状态i出发,t时刻返回状态的所有时间长{t : P(Xt= àX。= i) >0}的最大公约数是1,则称此马尔可夫链是非周期的(aperiodic),否则称马尔可夫链是周期的(periodic) .


直观上,一个非周期性的马尔可夫链,不存在一个状态,从这一个状态出发,再返回到这个状态时所经历的时间长呈一定的周期性,也就是说非周期性的马尔可夫链的任何状态都不具有周期性。


举例:

U1EEKZN]MI49GCJLY`$}61A.png


3. 正常返


]T{E)GYM`Z}25@JIN@8[KS5.png


直观上,一个正常返的马尔可夫链,其中任意一个状态,从其他任意一个状态出发,当时间趋于无穷时,首次转移到这个状态的概率不为L}QGGG4C@I6F)3HY08@VD4Q.png

定理:


不可约、非周期且正常返的马尔可夫链,有唯一平稳分布存在。


4. 遍历定理

设有马尔可夫链X= {Xo,X1,……, Xt,…},若这个马尔可夫链是不可约、非周期且正常返的,则该马尔可夫链有唯―平稳分布优 =(T1,T2,….)T,并且转移概率的极限分布是马尔可夫链的平稳分布:


$[_7GD2O`YR]((X~DQO%~IA.png

也就是:


IVSPBD6M%A{O(3H}DK[1CF9.png

%Z(W}MCL0A07_1{TMS`GA$L.png

样本均值可以认为是时间均值,数学期望是空间均值。遍历定理表述了遍历性的含义:当时间趋于无穷时,时间均值等于空间均值。


遍历定理的三个条件:不可约、非周期、正常返,保证了当时间趋于无穷时达到任意一个状态的概率不为R9D[@Z[DE2`I40MW[@JDF0V.png

73@6T6A)HO}]~@2{8Z2V})C.png

称为遍历均值。


5. 可逆马尔可夫链


  • 定义

RH02}_ZV{Q[RB873NA1E$FQ.png


则称此马尔可夫链为可逆马尔可夫链(reversible Markov chain),上式又被称作细致平衡方程(detailed balance equation)


直观上,如果有可逆马尔可夫链,那么以该马尔可夫链的平稳分布作为初始分布,进行随机状态转移,无论是面向过去还是面向未来,任何一个时刻的状态分布都是该平稳分布。


  • 定理

VMHZD`}$X~D93@YK2`X{J0M.png



该定理说明,可逆马尔可夫链一定有唯一平稳分布,给出了一个马尔可夫链有平稳分布的充分条件(不是必要条件)。也就是说,可逆马尔可夫链满足遍历定理的条件。


参考资料


ref:李航《统计学习方法》

相关文章
|
机器学习/深度学习
受限玻尔兹曼机|机器学习推导系列(二十五)
受限玻尔兹曼机|机器学习推导系列(二十五)
771 0
受限玻尔兹曼机|机器学习推导系列(二十五)
|
机器学习/深度学习 算法 数据挖掘
100天搞定机器学习|day44 k均值聚类数学推导与python实现
100天搞定机器学习|day44 k均值聚类数学推导与python实现
100天搞定机器学习|day44 k均值聚类数学推导与python实现
|
机器学习/深度学习 人工智能 移动开发
【机器学习】线性分类——高斯判别分析GDA(理论+图解+公式推导)
【机器学习】线性分类——高斯判别分析GDA(理论+图解+公式推导)
362 0
【机器学习】线性分类——高斯判别分析GDA(理论+图解+公式推导)
|
机器学习/深度学习 人工智能 算法
【机器学习】线性分类——线性判别分析LDA(理论+图解+公式推导)
【机器学习】线性分类——线性判别分析LDA(理论+图解+公式推导)
345 0
【机器学习】线性分类——线性判别分析LDA(理论+图解+公式推导)
|
机器学习/深度学习 算法
100天搞定机器学习|day38 反向传播算法推导
100天搞定机器学习|day38 反向传播算法推导
100天搞定机器学习|day38 反向传播算法推导
|
机器学习/深度学习 算法
变分推断|机器学习推导系列(十四)
变分推断|机器学习推导系列(十四)
212 0
变分推断|机器学习推导系列(十四)
|
机器学习/深度学习 算法
Sigmoid信念网络|机器学习推导系列(二十八)
Sigmoid信念网络|机器学习推导系列(二十八)
274 0
Sigmoid信念网络|机器学习推导系列(二十八)
|
机器学习/深度学习 算法
近似推断|机器学习推导系列(二十七)
近似推断|机器学习推导系列(二十七)
149 0
近似推断|机器学习推导系列(二十七)
|
机器学习/深度学习 算法
配分函数|机器学习推导系列(二十六)
配分函数|机器学习推导系列(二十六)
284 0
配分函数|机器学习推导系列(二十六)
|
机器学习/深度学习
高斯过程回归|机器学习推导系列(二十四)
高斯过程回归|机器学习推导系列(二十四)
521 0
高斯过程回归|机器学习推导系列(二十四)