备案控制台

开发者社区人工智能文章正文

MCMC-1|机器学习推导系列（十五）

2022-06-07 306

版权

版权声明：

本文内容由阿里云实名注册用户自发贡献，版权归原作者所有，阿里云开发者社区不拥有其著作权，亦不承担相应法律责任。具体规则请查看《阿里云开发者社区用户服务协议》和《阿里云开发者社区知识产权保护指引》。如果您发现本社区中有涉嫌抄袭的内容，填写侵权投诉表单进行举报，一经查实，本社区将立刻删除涉嫌侵权内容。

简介： MCMC-1|机器学习推导系列（十五）

一、蒙特卡洛方法

(04UY0[$BM6]9}U][`J@~9D.png

这里介绍三种采样方法：

概率分布采样

首先要求得概率密度函数PDF的累计密度函数CDF，然后求CDF得反函数，在0-1之间均匀取样，代入反函数，就得到了取样点。这个方法的缺点就是大部分PDF很难求得CDF：

@RU3T3(Q4[SZ@QU($]J]QG2.png

概率分布采样

拒绝采样（Rejection Sampling）

CPFGGT@W3`1FQE0$BYRF9SY.png

重要性采样有⼀个变种 Sampling-Importance-Resampling，这种方法，首先和上面⼀样进行采样，然后在采样出来的N个样本中，重新采样，这个重新采样，使⽤每个样本点的权重作为概率分布进行采样。

二、马尔可夫链

1. 齐次马尔科夫链

5)IL~`0S@@Q}[F3BOB6I}LW.png

2. 转移概率矩阵和状态分布

转移概率矩阵

YN129%W~X~G@AO71THC6MPC.png

状态分布

HEPC4}DGDWORY`T@9MCU`]X.png

其中：

Z480TWQ9G}7C06C_O}]P~AX.png

3. 平稳分布

定义

证明如下：

这个定理给出了一个求马尔可夫链平稳分布的方法。

4. 连续状态马尔可夫链

概率转移核

连续状态马尔可夫链的转移概率分布由概率转移核或转移核（transition kernel）表示。

EPJXGRSWXJFP9PZNGGDXX)K.png

或简写为：

I@YI)9I(7R(X]6{ZEOZ]Y2O.png

三、马尔可夫链的性质

以下通过离散状态马尔可夫链介绍马尔可夫链的性质，可以推广到连续状态马尔可夫链。

1. 不可约

直观上，一个不可约的马尔可夫链，从任意状态出发，当经过充分长时间后，可以到达任意状态。

举例：

YNU[0BFFGC[]HZT3`@]K23M.png

2. 非周期

在状态空间S中对于任意状态i∈ S，如果时刻0从状态i出发，t时刻返回状态的所有时间长{t : P(Xt= àX。= i) >0}的最大公约数是1，则称此马尔可夫链是非周期的(aperiodic)，否则称马尔可夫链是周期的(periodic) .

直观上，一个非周期性的马尔可夫链，不存在一个状态，从这一个状态出发，再返回到这个状态时所经历的时间长呈一定的周期性，也就是说非周期性的马尔可夫链的任何状态都不具有周期性。

举例：

U1EEKZN]MI49GCJLY`$}61A.png

3. 正常返

]T{E)GYM`Z}25@JIN@8[KS5.png

直观上，一个正常返的马尔可夫链，其中任意一个状态，从其他任意一个状态出发，当时间趋于无穷时，首次转移到这个状态的概率不为 L}QGGG4C@I6F)3HY08@VD4Q.png 。

定理：

不可约、非周期且正常返的马尔可夫链，有唯一平稳分布存在。

4. 遍历定理

设有马尔可夫链X= {Xo,X1,……, Xt,…}，若这个马尔可夫链是不可约、非周期且正常返的，则该马尔可夫链有唯―平稳分布优 =(T1,T2,….)T，并且转移概率的极限分布是马尔可夫链的平稳分布:

$[_7GD2O`YR]((X~DQO%~IA.png

也就是：

IVSPBD6M%A{O(3H}DK[1CF9.png

$%Z(W}MCL0A07_1{TMS`GA$L.png$

样本均值可以认为是时间均值，数学期望是空间均值。遍历定理表述了遍历性的含义：当时间趋于无穷时，时间均值等于空间均值。

遍历定理的三个条件：不可约、非周期、正常返，保证了当时间趋于无穷时达到任意一个状态的概率不为 R9D[@Z[DE2`I40MW[@JDF0V.png 。

73@6T6A)HO}]~@2{8Z2V})C.png

称为遍历均值。

5. 可逆马尔可夫链

定义

$RH02}_ZV{Q[RB873NA1E$FQ.png$

则称此马尔可夫链为可逆马尔可夫链（reversible Markov chain），上式又被称作细致平衡方程（detailed balance equation）。

直观上，如果有可逆马尔可夫链，那么以该马尔可夫链的平稳分布作为初始分布，进行随机状态转移，无论是面向过去还是面向未来，任何一个时刻的状态分布都是该平稳分布。

定理

VMHZD`}$X~D93@YK2`X{J0M.png

该定理说明，可逆马尔可夫链一定有唯一平稳分布，给出了一个马尔可夫链有平稳分布的充分条件（不是必要条件）。也就是说，可逆马尔可夫链满足遍历定理的条件。

参考资料

ref:李航《统计学习方法》

文章标签：

机器学习/深度学习

关键词：

机器学习平台 PAI推导

酷酷的群

目录

相关文章

酷酷的群

|

机器学习/深度学习

受限玻尔兹曼机|机器学习推导系列（二十五）

受限玻尔兹曼机|机器学习推导系列（二十五）

酷酷的群

677 0 0

受限玻尔兹曼机|机器学习推导系列（二十五）

壹佰、

|

机器学习/深度学习人工智能移动开发

【机器学习】线性分类——高斯判别分析GDA（理论+图解+公式推导）

【机器学习】线性分类——高斯判别分析GDA（理论+图解+公式推导）

壹佰、

285 0 0

【机器学习】线性分类——高斯判别分析GDA（理论+图解+公式推导）

壹佰、

|

机器学习/深度学习人工智能算法

【机器学习】线性分类——线性判别分析LDA（理论+图解+公式推导）

【机器学习】线性分类——线性判别分析LDA（理论+图解+公式推导）

壹佰、

186 0 0

【机器学习】线性分类——线性判别分析LDA（理论+图解+公式推导）

游客su25awkxr62sa

|

机器学习/深度学习算法数据挖掘

100天搞定机器学习|day44 k均值聚类数学推导与python实现

100天搞定机器学习|day44 k均值聚类数学推导与python实现

游客su25awkxr62sa

116 1 1

100天搞定机器学习|day44 k均值聚类数学推导与python实现

游客su25awkxr62sa

|

机器学习/深度学习算法

100天搞定机器学习|day38 反向传播算法推导

100天搞定机器学习|day38 反向传播算法推导

游客su25awkxr62sa

97 0 0

100天搞定机器学习|day38 反向传播算法推导

酷酷的群

|

机器学习/深度学习算法

Sigmoid信念网络|机器学习推导系列（二十八）

Sigmoid信念网络|机器学习推导系列（二十八）

酷酷的群

217 0 0

Sigmoid信念网络|机器学习推导系列（二十八）

酷酷的群

|

机器学习/深度学习算法

近似推断|机器学习推导系列（二十七）

近似推断|机器学习推导系列（二十七）

酷酷的群

120 0 0

近似推断|机器学习推导系列（二十七）

酷酷的群

|

机器学习/深度学习算法

配分函数|机器学习推导系列（二十六）

配分函数|机器学习推导系列（二十六）

酷酷的群

229 0 0

配分函数|机器学习推导系列（二十六）

酷酷的群

|

机器学习/深度学习

高斯过程回归|机器学习推导系列（二十四）

高斯过程回归|机器学习推导系列（二十四）

酷酷的群

459 0 0

高斯过程回归|机器学习推导系列（二十四）

酷酷的群

|

机器学习/深度学习

贝叶斯线性回归|机器学习推导系列（二十三）

贝叶斯线性回归|机器学习推导系列（二十三）

酷酷的群

279 0 0

贝叶斯线性回归|机器学习推导系列（二十三）

热门文章

最新文章

[机器学习] 1、《机器学习系统设计》学后总结

基于区块链的机器学习模型创建方案

09 机器学习调参

机器学习小白，还不快pick一下——【视觉与图像：阈值分割】

周志华《机器学习》课后习题（第九章）：聚类

Andrew Ng机器学习课程笔记--week9(上)(异常检测&推荐系统)

《R语言机器学习：实用案例分析》——1.3节使用函数

基于机器学习平台PAI的AI绘画最佳实践（一）

使用SAP Cloud Platform Leonardo机器学习提取图片的特征向量

自动化机器学习将成为下一个AI研究主流？听听数据科学家怎么说

【Python机器学习专栏】Python环境下的机器学习库概览

【python】Python大豆特征数据分析 [机器学习版一]（代码+论文）【独一无二】

机器学习实战第3天：手写数字识别

机器学习库：numpy

机器学习第11天：降维

构建高效机器学习模型的五大技巧

构建高效机器学习模型：从数据预处理到模型优化

构建高效机器学习模型：从特征工程到模型调优

Machine Learning机器学习之贝叶斯网络(BayesianNetwork)

Machine Learning机器学习之决策树算法 Decision Tree（附Python代码）

相关课程

更多

机器学习入门-概念原理及常用算法

机器学习概览及常见算法

场景实践 - 基于阿里云PAI机器学习平台使用时间序列分解模型预测商品销量

PAI平台学习路线：机器学习入门到应用

场景实践 - 基于机器学习进行收入预测分析

高校精品课-复旦大学-机器学习与深度学习

相关电子书

更多

大规模机器学习在蚂蚁+阿里的应用

基于Spark的面向十亿级别特征的大规模机器学习

基于Spark的大规模机器学习在微博的应用

相关实验场景

更多

如何快速训练大模型

【文生文】一键部署ChatYuan模型

欧拉图的构造性证明与算法实现

零基础入门Serverless：基于函数计算快速搭建基于人工智能的目标检测系统

推荐系统入门之使用ALS算法实现打分预测

自然语言入门：NLP数据读取与数据分析

下一篇

2024年阿里云免费云服务器及学生云服务器申请教程参考