备案控制台

开发者社区人工智能文章正文

MCMC-2|机器学习推导系列（十六）

2022-06-07 471

版权

版权声明：

本文内容由阿里云实名注册用户自发贡献，版权归原作者所有，阿里云开发者社区不拥有其著作权，亦不承担相应法律责任。具体规则请查看《阿里云开发者社区用户服务协议》和《阿里云开发者社区知识产权保护指引》。如果您发现本社区中有涉嫌抄袭的内容，填写侵权投诉表单进行举报，一经查实，本社区将立刻删除涉嫌侵权内容。

简介： MCMC-2|机器学习推导系列（十六）

一、概述

1. 概述

在对一个概率分布进行随机抽样，或者是求函数关于该概率分布的数学期望时可以使用马尔可夫链蒙特卡罗法（MCMC）。相比于拒绝采样法和重要性采样法，MCMC更适用于随机变量是多元的、概率密度函数是非标准形式的、随机变量各分量不独立等情况。

P81_GXOMURP$VY5H]M]8`K5.png

2. 需要注意的几个知识点

由于这个马尔可夫链满足遍历定理，随机游走的初始点并不影响得到的结果，也就是说从不同的起始点出发，都会收敛到同一平稳分布。

MCMC的收敛性的判断往往是经验性的，比如，在马尔可夫链上进行随机游走，检验遍历均值是否收敛。具体的方法有：

①每隔一段时间取一次样本，得到多个样本以后，计算遍历均值，当计算的均值稳定后，认为马尔可夫链已经收敛。

②在马尔可夫链上并行进行多个随机游走，比较各个随机游走的遍历均值是否接近一致。

MCMC中得到的样本序列，相邻的样本点是相关的，而不是独立的。因此，在需要独立样本时，可以在该样本序列中再次进行随机抽样，比如每隔一段时间取一次样本，将这样得到的子样本集合作为独立样本集合。

一般来说，MCMC比拒绝采样法更容易实现，因为只需要定义马尔可夫链，而不需要定义建议分布。一般来说MCMC比拒绝采样效率更高，因为没有大量被拒绝的样本，虽然燃烧期的成本也要抛弃。

3. 马尔可夫链蒙特卡罗法的基本步骤

4N1{AH6)FKYPF5895@Z6CJ1.png

二、Metropilis-Hastings算法（MH算法）

1. 基本原理

0]CB@W[FD`5PIB@E3X`D)M3.png

2. 定理

6LGMNX(U@MM7}NAH5Q(~C0G.png

3. 建议分布

第一种形式

%747IUSS08C%JT82873MP{R.png

FJBZ9K%9~%M7[GP(2(GPQVJ.png

4. 满条件分布

~KM@DS8X_WCK(K9SMO)]5YJ.png

5. 基本步骤

6. 单分量MH算法

在MH算法中，通常需要对多元变量分布进行抽样，有时对多元变量的抽样是困难的。可以对多元变量的每一变量的条件分布依次分别进行抽样，从而实现对整个多元变量的一次抽样，这就是单分量MH（single-component Metropolis-Hastings）算法。

RZCAH%Q0P5R4)G(8)%JC${7.png

$_6({%2XQZ~W[@L[@Z38C915.png$

三、吉布斯抽样

吉布斯抽样可以认为是MH算法的特殊情况，但是更容易实现，因此被广泛使用。

1. 基本原理

吉布斯抽样（Gabbs sampling）用于多元变量联合分布的抽样和估计。其基本做法是，从联合概率分布定义满条件概率分布，依次对满条件概率分布进行抽样，得到样本的序列。可以证明这样的抽样过程是在一个马尔可夫链上的随机游走，每一个样本对应着马尔可夫链的状态，平稳分布就是目标的联合分布。整体成为一个MCMC，燃烧期之后的样本就是联合分布的随机样本。

$({UMYN(G[_W`A9Y$JL%2`M1.png$

$({UMYN(G[_W`A9Y$JL%2`M1.png$

2. 吉布斯抽样与单分量MH算法的关系

6FC6I_9QH@NE@G$}]FR}]MU.png

3. 基本步骤

5%@XMBD599%(1VRTEME65]G.png

4. 对比单分量MH算法

单分量MH算法与吉布斯抽样的不同之处在于，在前者算法中，抽样会在样本点之间移动，但其间可能在某一些样本点上停留（由于采样被拒绝）；而在后者算法中，抽样点会在样本点之间持续移动。

吉布斯抽样适合于满条件概率分布容易抽样的情况，而单分量MH算法适合于满条件概率分布不容易抽样的情况，这时使用容易抽样的条件分布作建议分布。

参考资料

ref:李航《统计学习方法》

文章标签：

机器学习/深度学习

算法

关键词：

机器学习平台 PAI推导

酷酷的群

目录

相关文章

酷酷的群

|

机器学习/深度学习

受限玻尔兹曼机|机器学习推导系列（二十五）

受限玻尔兹曼机|机器学习推导系列（二十五）

酷酷的群

798 0 0

受限玻尔兹曼机|机器学习推导系列（二十五）

玩机器学习的章北海-13621

|

机器学习/深度学习算法数据挖掘

100天搞定机器学习|day44 k均值聚类数学推导与python实现

100天搞定机器学习|day44 k均值聚类数学推导与python实现

玩机器学习的章北海-13621

157 1 1

100天搞定机器学习|day44 k均值聚类数学推导与python实现

壹佰、

|

机器学习/深度学习人工智能移动开发

【机器学习】线性分类——高斯判别分析GDA（理论+图解+公式推导）

【机器学习】线性分类——高斯判别分析GDA（理论+图解+公式推导）

壹佰、

478 0 0

【机器学习】线性分类——高斯判别分析GDA（理论+图解+公式推导）

壹佰、

|

机器学习/深度学习人工智能算法

【机器学习】线性分类——线性判别分析LDA（理论+图解+公式推导）

【机器学习】线性分类——线性判别分析LDA（理论+图解+公式推导）

壹佰、

510 0 0

【机器学习】线性分类——线性判别分析LDA（理论+图解+公式推导）

玩机器学习的章北海-13621

|

机器学习/深度学习算法

100天搞定机器学习|day38 反向传播算法推导

100天搞定机器学习|day38 反向传播算法推导

玩机器学习的章北海-13621

138 0 0

100天搞定机器学习|day38 反向传播算法推导

酷酷的群

|

机器学习/深度学习

MCMC-1|机器学习推导系列（十五）

MCMC-1|机器学习推导系列（十五）

酷酷的群

385 0 1

MCMC-1|机器学习推导系列（十五）

酷酷的群

|

机器学习/深度学习算法

变分推断|机器学习推导系列（十四）

变分推断|机器学习推导系列（十四）

酷酷的群

228 0 1

变分推断|机器学习推导系列（十四）

酷酷的群

|

机器学习/深度学习算法

Sigmoid信念网络|机器学习推导系列（二十八）

Sigmoid信念网络|机器学习推导系列（二十八）

酷酷的群

298 0 0

Sigmoid信念网络|机器学习推导系列（二十八）

酷酷的群

|

机器学习/深度学习算法

近似推断|机器学习推导系列（二十七）

近似推断|机器学习推导系列（二十七）

酷酷的群

171 0 0

近似推断|机器学习推导系列（二十七）

酷酷的群

|

机器学习/深度学习算法

配分函数|机器学习推导系列（二十六）

配分函数|机器学习推导系列（二十六）

酷酷的群

313 0 0

配分函数|机器学习推导系列（二十六）

热门文章

最新文章

机器学习-异常检测算法（二）：Local Outlier Factor

【通俗易懂】机器学习中 L1 和 L2 正则化的直观解释

Andrew Ng机器学习课程笔记--week10(优化梯度下降)

数据驱动！精细化运营！用机器学习做客户生命周期与价值预估！⛵

阿里云PAI-EAS：一键部署通义千问模型的理想平台

初识机器学习_你需要知道的基本概念罗列_以PY为工具

问答Goodfellow：没有样例能不能训练机器学习算法？

机器学习开发者不可错过的ModelScope开源模型社区

PAI-DSW快速启动AI绘画Stable Diffusion WebUI

Elastic：机器学习的实践 - multi metric job

基于Python_opencv人脸录入、识别系统（应用dlib机器学习库）（下）

基于Python_opencv人脸录入、识别系统（应用dlib机器学习库）（上）

深入Scikit-learn：掌握Python最强大的机器学习库

OpenCV（Open Source Computer Vision Library）是一个开源的计算机视觉和机器学习库，它提供了大量的函数和工具，用于处理图像和视频数据。

介绍文本分类的基本概念、常用方法以及如何在Python中使用机器学习库进行文本分类

探索Scikit-learn：机器学习库的入门与进阶

深度解析Python中的机器学习库：Scikit-learn

【Python机器学习专栏】Python环境下的机器学习库概览

探秘scikit-learn：机器学习库的核心功能详解

【python】Python大豆特征数据分析 [机器学习版一]（代码+论文）【独一无二】

相关课程

更多

机器学习入门-概念原理及常用算法

场景实践 - 基于阿里云PAI机器学习平台使用时间序列分解模型预测商品销量

机器学习概览及常见算法

场景实践 - 基于机器学习进行收入预测分析

PAI平台学习路线：机器学习入门到应用

高校精品课-复旦大学-机器学习与深度学习

相关电子书

更多

大规模机器学习在蚂蚁+阿里的应用

基于Spark的面向十亿级别特征的大规模机器学习

基于Spark的大规模机器学习在微博的应用

相关实验场景

更多

欧拉图的构造性证明与算法实现

推荐系统入门之使用ALS算法实现打分预测

下一篇

PAI Model Gallery 支持云上一键部署 DeepSeek-V3、DeepSeek-R1 系列模型