MCMC(一)蒙特卡罗方法

简介:

1. MCMC概述

    从名字我们可以看出,MCMC由两个MC组成,即蒙特卡罗方法(Monte Carlo Simulation,简称MC)和马尔科夫链(Markov Chain ,也简称MC)。要弄懂MCMC的原理我们首先得搞清楚蒙特卡罗方法和马尔科夫链的原理。我们将用三篇来完整学习MCMC。在本篇,我们关注于蒙特卡罗方法。

2. 蒙特卡罗方法引入

    蒙特卡罗原来是一个赌场的名称,用它作为名字大概是因为蒙特卡罗方法是一种随机模拟的方法,这很像赌博场里面的扔骰子的过程。最早的蒙特卡罗方法都是为了求解一些不太好求解的求和或者积分问题。比如积分:

θ = a b f ( x ) d x

    如果我们很难求解出 f ( x ) 的原函数,那么这个积分比较难求解。当然我们可以通过蒙特卡罗方法来模拟求解近似值。如何模拟呢?假设我们函数图像如下图:

    则一个简单的近似求解方法是在[a,b]之间随机的采样一个点。比如 x 0 ,然后用 f ( x 0 ) 代表在[a,b]区间上所有的 f ( x ) 的值。那么上面的定积分的近似求解为:

( b a ) f ( x 0 )

    当然,用一个值代表[a,b]区间上所有的 f ( x ) 的值,这个假设太粗糙。那么我们可以采样[a,b]区间的n个值: x 0 , x 1 , . . . x n 1 ,用它们的均值来代表[a,b]区间上所有的 f ( x ) 的值。这样我们上面的定积分的近似求解为:

b a n i = 0 n 1 f ( x i )

    虽然上面的方法可以一定程度上求解出近似的解,但是它隐含了一个假定,即 x 在[a,b]之间是均匀分布的,而绝大部分情况, x 在[a,b]之间不是均匀分布的。如果我们用上面的方法,则模拟求出的结果很可能和真实值相差甚远。 

    怎么解决这个问题呢? 如果我们可以得到 x 在[a,b]的概率分布函数 p ( x ) ,那么我们的定积分求和可以这样进行:

θ = a b f ( x ) d x = a b f ( x ) p ( x ) p ( x ) d x 1 n i = 0 n 1 f ( x i ) p ( x i )

    上式最右边的这个形式就是蒙特卡罗方法的一般形式。当然这里是连续函数形式的蒙特卡罗方法,但是在离散时一样成立。

    可以看出,最上面我们假设 x 在[a,b]之间是均匀分布的时候, p ( x i ) = 1 / ( b a ) ,带入我们有概率分布的蒙特卡罗积分的上式,可以得到:

1 n i = 0 n 1 f ( x i ) 1 / ( b a ) = b a n i = 0 n 1 f ( x i )

    也就是说,我们最上面的均匀分布也可以作为一般概率分布函数 p ( x ) 在均匀分布时候的特例。那么我们现在的问题转到了如何求出 x 的分布 p ( x ) 的若干和样本上来。

3. 概率分布采样

    上一节我们讲到蒙特卡罗方法的关键是得到 x 的概率分布。如果求出了 x 的概率分布,我们可以基于概率分布去采样基于这个概率分布的n个 x 的样本集,带入蒙特卡罗求和的式子即可求解。但是还有一个关键的问题需要解决,即如何基于概率分布去采样基于这个概率分布的n个 x 的样本集。 

    对于常见的均匀分布 u n i f o r m ( 0 , 1 ) 是非常容易采样样本的,一般通过线性同余发生器可以很方便的生成(0,1)之间的伪随机数样本。而其他常见的概率分布,无论是离散的分布还是连续的分布,它们的样本都可以通过 u n i f o r m ( 0 , 1 ) 的样本转换而得。比如二维正态分布的样本 ( Z 1 , Z 2 ) 可以通过通过独立采样得到的 u n i f o r m ( 0 , 1 ) 样本对 ( X 1 , X 2 ) 通过如下的式子转换而得:

Z 1 = 2 l n X 1 c o s ( 2 π X 2 )
Z 2 = 2 l n X 1 s i n ( 2 π X 2 )

    其他一些常见的连续分布,比如t分布,F分布,Beta分布,Gamma分布等,都可以通过类似的方式从 u n i f o r m ( 0 , 1 ) 得到的采样样本转化得到。在python的numpy,scikit-learn等类库中,都有生成这些常用分布样本的函数可以使用。

    不过很多时候,我们的 x 的概率分布不是常见的分布,这意味着我们没法方便的得到这些非常见的概率分布的样本集。那这个问题怎么解决呢?

4. 接受-拒绝采样

    对于概率分布不是常见的分布,一个可行的办法是采用接受-拒绝采样来得到该分布的样本。既然  p ( x )  太复杂在程序中没法直接采样,那么我设定一个程序可采样的分布  q ( x )  比如高斯分布,然后按照一定的方法拒绝某些样本,以达到接近  p ( x )  分布的目的,其中 q ( x ) 叫做 proposal distribution。

    具体采用过程如下,设定一个方便采样的常用概率分布函数  q ( x ) ,以及一个常量  k ,使得  p ( x )  总在  k q ( x )  的下方。如上图。

    首先,采样得到 q ( x ) 的一个样本 z 0 ,采样方法如第三节。然后,从均匀分布 0 , k q ( z 0 ) ) 中采样得到一个值 u 。如果 u 落在了上图中的灰色区域,则拒绝这次抽样,否则接受这个样本 z 0 。重复以上过程得到n个接受的样本 z 0 , z 1 , . . . z n 1 ,则最后的蒙特卡罗方法求解结果为:

1 n i = 0 n 1 f ( z i ) p ( z i )

    整个过程中,我们通过一系列的接受拒绝决策来达到用 q ( x ) 模拟 p ( x ) 概率分布的目的。

5. 蒙特卡罗方法小结

    使用接受-拒绝采样,我们可以解决一些概率分布不是常见的分布的时候,得到其采样集并用蒙特卡罗方法求和的目的。但是接受-拒绝采样也只能部分满足我们的需求,在很多时候我们还是很难得到我们的概率分布的样本集。比如:

    1)对于一些二维分布 p ( x , y ) ,有时候我们只能得到条件分布 p ( x | y ) p ( y | x ) 和,却很难得到二维分布 p ( x , y ) 一般形式,这时我们无法用接受-拒绝采样得到其样本集。

    2)对于一些高维的复杂非常见分布 p ( x 1 , x 2 , . . . , x n ) ,我们要找到一个合适的 q ( x ) k 非常困难。

    从上面可以看出,要想将蒙特卡罗方法作为一个通用的采样模拟求和的方法,必须解决如何方便得到各种复杂概率分布的对应的采样样本集的问题。而我们下一篇要讲到的马尔科夫链就是帮助找到这些复杂概率分布的对应的采样样本集的白衣骑士。下一篇我们来总结马尔科夫链的原理。


本文转自刘建平Pinard博客园博客,原文链接:http://www.cnblogs.com/pinard/p/6625739.html,如需转载请自行联系原作者


相关文章
|
人工智能 自然语言处理 安全
搭建微信公众号AI助手
将微信公众号(订阅号)变为AI智能客服仅需四步:创建大模型问答应用、搭建微信公众号连接流、引入AI智能客服及增加私有知识。首先在百炼平台创建应用并获取API密钥;其次利用阿里云AppFlow服务无代码连接微信公众号与大模型应用;接着配置公众号引入AI客服;最后上传企业知识文档提升客服精准度。通过这些步骤,轻松实现智能化客户服务。
1549 2
|
Java 开发者 数据安全/隐私保护
spring-data-jpa Repository的基本知识
1.项目中的Repository对象的使用   2.Repository 引入的两种方式    继承和使用注解 3.Repository接口的定义 Repository 接口是 spring Data 的一个核心接口,它不提供任何方法,开发者需要在自己定义的接口中声明需要的方法 public interface Repository { }   4.Repository接口的层级关系     基础的 Repository 提供了最基本的数据访问功能,其几个子接口则扩展了一些功能。
1050 0
|
2天前
|
云安全 人工智能 算法
以“AI对抗AI”,阿里云验证码进入2.0时代
三层立体防护,用大模型打赢人机攻防战
1294 3
|
3天前
|
机器学习/深度学习 安全 API
MAI-UI 开源:通用 GUI 智能体基座登顶 SOTA!
MAI-UI是通义实验室推出的全尺寸GUI智能体基座模型,原生集成用户交互、MCP工具调用与端云协同能力。支持跨App操作、模糊语义理解与主动提问澄清,通过大规模在线强化学习实现复杂任务自动化,在出行、办公等高频场景中表现卓越,已登顶ScreenSpot-Pro、MobileWorld等多项SOTA评测。
588 3
|
3天前
|
人工智能 Rust 运维
这个神器让你白嫖ClaudeOpus 4.5,Gemini 3!还能接Claude Code等任意平台
加我进AI讨论学习群,公众号右下角“联系方式”文末有老金的 开源知识库地址·全免费
|
10天前
|
编解码 人工智能 自然语言处理
⚽阿里云百炼通义万相 2.6 视频生成玩法手册
通义万相Wan 2.6是全球首个支持角色扮演的AI视频生成模型,可基于参考视频形象与音色生成多角色合拍、多镜头叙事的15秒长视频,实现声画同步、智能分镜,适用于影视创作、营销展示等场景。
719 4
|
3天前
|
存储 弹性计算 安全
阿里云服务器4核8G收费标准和活动价格参考:u2a实例898.20元起,计算型c9a3459.05元起
现在租用阿里云服务器4核8G价格是多少?具体价格及配置详情如下:云服务器ECS通用算力型u2a实例,配备4核8G配置、1M带宽及40G ESSD云盘(作为系统盘),其活动价格为898.20元/1年起;此外,ECS计算型c9a实例4核8G配置搭配20G ESSD云盘,活动价格为3459.05元/1年起。在阿里云的当前活动中,4核8G云服务器提供了多种实例规格供用户选择,不同实例规格及带宽的组合将带来不同的优惠价格。本文为大家解析阿里云服务器4核8G配置的实例规格收费标准与最新活动价格情况,以供参考。
245 150