L5-参数估计:矩估计与极大似然估计

简介: L5-参数估计:矩估计与极大似然估计

1. 定义


参数估计(parameter estimation)指根据从总体中抽取的随机样本估计总体分布中未知参数的过程。


据参数估计的性质不同,分成以下两种类型


点估计:用样本统计量的某一具体数值直接推断未知的总体参数,常用方法包括极大似然估计、贝叶斯估计、矩估计、最小二乘法等。

区间估计:在点估计的基础上,由样本统计量所构造的总体参数的置信区间。


e.g. 天气预报,明天最高温度:


  • 点估计:12℃.
  • 区间估计:11℃ -13℃.


点估计


设总体X XX的分布函数F ( x ; θ ) 的形式已知,θ是待估参数。X1 X2  ,X 3 … , X n 是总体X XX的一个样本,X1  ,X2    , X 3   , … , x n 是相应的样本值。

构造一个适当的统计量θ ^ ( X 1 , X 2 , … , X n ),用它的观察值θ ^ ( X1 X2  , … , x n )来估计未知参数θ

θ ^ (X1 X2   … , X n ) 为θ的估计量;θ ^ (X1 X2   , … , x n )为 θ  的估计值。这种对未知参数进行定值估计的问题就是点估计。


2. 矩估计


用样本矩作为总体矩的估计即为矩估计(以样本矩的函数估计总体矩的函数)。

理论根据:辛钦大数定律和依概率收敛的性质(样本k 阶原点矩依概率收敛于总体k 阶原点矩)。


(1)建立( θ 1 , θ 2 , … , θ k ) 与( μ l , μ 2 , … , μ k ) 的联系


设总体矩E ( x 1) = μ l存在,l = 1 , 2 , … , k ,则μ l是θ = ( θ 1 , θ 2 , … , θ k ) 的函数

记作

image.png

由大数定律得

image.png

用样本矩代替总体矩,令Ai =μ l,l=1,2,,k

其中,


image.png


这是包含k个未知参数θ 1 , θ 2 , … , θ k 的联合方程组(等式左侧为样本矩,右侧为总体矩),

image.png


(2)解出方程组的解,记为image.png

image.png

3. 极大似然估计


一个盒子装有黑球与白球,假设已经知道两种球的数目比是1:3,但不知道哪种颜色的球多。采用放回抽样方法从盒子中取5个球,观察结果为:4黑1白,估计取到黑球的概率p.

image.png


则X ∼ B ( 1 , p ) ,其中p 为取到黑球的概率,p = 1 / 4 或 3 / 4


当p = 1 / 4 时,出现本次观察结果的概率为image.png

当p = 3 / 4 时,出现本次观察结果的概率为image.png

由于image.png,即当p = 3 /4时,出现观察结果的概率更大,因此取p = 3/ 4


3.1 定义


极大似然估计法是在总体的分布类型已知的条件下使用的一种参数估计方法。


(1)X 为离散型,已知X 的分布P{X=x}=p(x;θ),θ ∈ Θ 未知。


样本( X 1 , X 2 , … , X n ) 的观测值为( x 1 , x 2 , … , x n ) ,X i  与X 同分布且相互独立

image.png

似然函数


image.png

对于给定样本值image.png满足

image.png

则称image.png为θ 的极大似然估计值image.png为θ 的极大似然估计量(MLE)。该参数对应分布最有可能产生已观测样本值。


(2)X 为连续型,概率密度为f ( x ; θ ) 未知。


来自总体的样本( X1 X2 , … , X n ) 的观测值为(X1 X2 , … , x n ) ,作为与总体X 同分布且相互独立的n 维随机变量,样本的联合概率密度为:


image.png


似然函数


image.png



解得θ

此外,若θ ^ 是θ 的极大似然估计,则g ( θ ) 的极大似然估计为g ( θ ^ )


3.2 举例


e.g.1 一个盒子装有黑球与白球,有放回地取n个球,其中有k 个黑球。求盒子中黑球与白球数之比R 的极大似然估计量。


设盒子中有a 只黑球与b 只白球,则R = a / b


image.png

则X ∼ B ( 1 , p )


image.png


似然函数


image.png

e.g.2 设X ∼ N ( μ ,σ 2   ) ;μ 已知σ 2  为未知参数,X1 X2, … , x n是来自X 的一个样本值,求σ 2  的极大似然估计量。


X 的概率密度为:

image.png


似然函数


image.png


相关文章
|
9天前
|
数据采集
R语言用线性模型进行臭氧预测: 加权泊松回归,普通最小二乘,加权负二项式模型,多重插补缺失值
R语言用线性模型进行臭氧预测: 加权泊松回归,普通最小二乘,加权负二项式模型,多重插补缺失值
|
9天前
|
数据可视化
R语言极值推断:广义帕累托分布GPD使用极大似然估计、轮廓似然估计、Delta法
R语言极值推断:广义帕累托分布GPD使用极大似然估计、轮廓似然估计、Delta法
10 1
|
8天前
|
算法
Metropolis Hastings采样和贝叶斯泊松回归Poisson模型
Metropolis Hastings采样和贝叶斯泊松回归Poisson模型
19 0
|
5月前
|
机器学习/深度学习 算法
24 正态分布和最大熵
24 正态分布和最大熵
40 0
|
5月前
14 棣莫弗的二项概率逼近
14 棣莫弗的二项概率逼近
28 0
|
7月前
|
资源调度 数据处理
第8章 概率统计——8.1 产生随机变量
第8章 概率统计——8.1 产生随机变量
|
算法 定位技术
最优化方法(最速下降、牛顿法、高斯牛顿法、LM算法)
最优化方法(最速下降、牛顿法、高斯牛顿法、LM算法)
379 0
最优化方法(最速下降、牛顿法、高斯牛顿法、LM算法)
|
8月前
|
数据采集 算法 Python
[模型]拉格朗日插值法
[模型]拉格朗日插值法
|
10月前
曲线拟合-最小二乘法
线性最小二乘法及matlab例程
|
机器学习/深度学习
先验分布、后验分布、似然估计、贝叶斯估计、最大似然估计
先验分布、后验分布、似然估计、贝叶斯估计、最大似然估计
127 0
先验分布、后验分布、似然估计、贝叶斯估计、最大似然估计