R语言极值推断:广义帕累托分布GPD使用极大似然估计、轮廓似然估计、Delta法

简介: R语言极值推断:广义帕累托分布GPD使用极大似然估计、轮廓似然估计、Delta法

本文是极端值推断的内容。我们在广义帕累托分布上使用最大似然方法。

  • 极大似然估计

在参数模型的背景下,标准技术是考虑似然的最大值(或对数似然)。考虑到一些技术性假设,如 的某个邻域,那么

其中 表示费雪信息矩阵。在此考虑一些样本,来自广义帕累托分布,参数为 ,因此

如果我们解决极大似然的一阶条件,我们得到一个满足以下条件的估计

这种渐进正态性的概念如下:如果样本的真实分布是一个具有参数 的GPD,那么,如果n足够大,就会有一个联合正态分布 。因此,如果我们产生大量的样本(足够大,例如200个观测值),那么估计的散点图应该与高斯分布的散点图相同。

> for(s in 1:1000){
+ param\[s,\]=gpd(x,0)$par.ests
> image(x,y,z)

得到一个3D的表示

> persp(x,y,t(z)
+ xlab="xi",ylab="sigma")

有了200个观测值,如果真正的基础分布是GPD,那么,联合分布 是正态的。

  • Delta德尔塔法

另一个重要的属性是德尔塔法。这个想法是,如果是渐进正态,足够平滑,那么也是渐进高斯的。

从这个属性中,我们可以得到 (这是极值模型中使用的另一个参数化)的正态性,或者在任何四分位数 上 。我们运行一些模拟,再一次检查联合正态性。

> for(s in 1:1000)
+ gpd(x,0)$par.ests
+ q=sha * (.01^(-xih) - 1)/xih
+ tvar=q+(sha + xih * q)/(1 - xih)
dmnorm(cbind(vx,vy),m,S)
> image(x,y,t(z)

正如我们所看到的,在样本大小为200的情况下,我们不能使用这个渐进式的结果:看起来我们没有足够的数据。但是,如果我们在n=5000运行同样的代码,

``````
> n=5000

我们得到 的联合正态性。这就是我们可以从这个结果中得到的delta-方法。

  • 轮廓似然( Profile Likelihood )

另一个有趣的方法是Profile 似然函数的概念。因为尾部指数 在这里是辅助参数。

这可以用来推导出置信区间。在GPD的情况下,对于每个 ,我们必须找到一个最优的 。我们计算Profile 似然函数,即 。而我们可以计算出这个轮廓似然的最大值。一般来说,这个两阶段的优化与(全局)最大似然是不等价的,计算结果如下

+  profilelikelihood=function(beta){
+  -loglik(XI,beta) }
+  L\[i\]=-optim(par=1,fn=profilelik)$value }

如果我们想计算轮廓似然的最大值(而不是像以前那样只计算网格上的轮廓似然的值),我们使用

+  profile=function(beta){
+  -loglikelihood(XI,beta) }
(OPT=optimize(f=PL,interval=c(0,3)))

我们得到结果和最大似然估计的 相似。我们可以用这种方法来计算置信区间,在图表上将其可视化

> line(h=-up-qchisq(p=.95,df=1)
>  I=which(L>=-up-qchisq(p=.95,df=1))
>  lines(XIV\[I\]

竖线是参数 95%置信区间的下限和上限。


相关文章
|
5天前
【视频】什么是非线性模型与R语言多项式回归、局部平滑样条、 广义相加GAM分析工资数据|数据分享(上)
【视频】什么是非线性模型与R语言多项式回归、局部平滑样条、 广义相加GAM分析工资数据|数据分享
14 0
|
2天前
|
算法 Python
R语言随机波动模型SV:马尔可夫蒙特卡罗法MCMC、正则化广义矩估计和准最大似然估计上证指数收益时间序列
R语言随机波动模型SV:马尔可夫蒙特卡罗法MCMC、正则化广义矩估计和准最大似然估计上证指数收益时间序列
15 7
|
5天前
【视频】什么是非线性模型与R语言多项式回归、局部平滑样条、 广义相加GAM分析工资数据|数据分享(下)
【视频】什么是非线性模型与R语言多项式回归、局部平滑样条、 广义相加GAM分析工资数据|数据分享
|
13天前
|
数据采集
R语言用线性模型进行臭氧预测: 加权泊松回归,普通最小二乘,加权负二项式模型,多重插补缺失值
R语言用线性模型进行臭氧预测: 加权泊松回归,普通最小二乘,加权负二项式模型,多重插补缺失值
11 0
|
12天前
样条曲线分段线性回归模型piecewise regression估计个股beta值分析收益率数据
样条曲线分段线性回归模型piecewise regression估计个股beta值分析收益率数据
14 0
|
14天前
R语言异方差回归模型建模:用误差方差解释异方差
R语言异方差回归模型建模:用误差方差解释异方差
|
14天前
|
大数据
stata具有异方差误差的区间回归
stata具有异方差误差的区间回归
18 5
|
14天前
|
数据挖掘
R语言中的block Gibbs吉布斯采样贝叶斯多元线性回归
R语言中的block Gibbs吉布斯采样贝叶斯多元线性回归
13 0
|
8月前
|
Serverless
第8章 概率统计——8.2 概率密度计算
第8章 概率统计——8.2 概率密度计算
|
11月前
R-ggpmisc|回归曲线添加回归方程,R2,方差表,香不香?
R-ggpmisc|回归曲线添加回归方程,R2,方差表,香不香?

热门文章

最新文章