R语言极值理论:希尔HILL统计量尾部指数参数估计可视化

简介: R语言极值理论:希尔HILL统计量尾部指数参数估计可视化

原文链接:http://tecdat.cn/?p=26277 

极值理论对样本尾部分布的极值指数的估计方法主要有两类:半参数方法和全 参数方法,前者主要是基于分布尾部的 Hill 估计量,后者则主要基于广义帕累托分布。

尾部指数的希尔HILL统计量估计。更具体地说,我们看到如果 image.png , 和 image.png ,然后希尔HILL估计为 image.png

image.png

image.png 。然后 image.png 在某种意义上满足某种一致性 image.png ,如果 image.png ,即 image.png (在收敛速度的附加假设下, image.png )。此外,在附加的技术条件下

image.png

为了说明这一点,请考虑以下代码。首先,让我们考虑一个帕累托生存函数,以及相关的分位数函数

> Q=fuction(p){unro(funion(x) S(x)-(1-p),loer=1,per=1e+9)$root}

我们将考虑更复杂的生存函数。这是生存函数和分位数函数,

> plot(u,Veie(Q)(u),type="l")

image.png

在这里,我们需要 分位数函数从这个分布中生成一个随机样本,

> X=Vectorize(Q)(runif(n))

hill统计量在这里

> abline(h=alpha)

image.png



我们现在可以生成数千个随机样本,并查看这些估计器(对于某些特定的k)。


> for(s in 1:ns){
+ X=Vectorize
+ H=hill
+ hilk=function(k) 
+ HilK\[s,\]=Vectorize
+ }

image.png

如果我们计算平均值,

> plot(15*(1:10),apply(2,mean)

image.png

我们得到了一系列可以被认为是无偏的估计量。

现在,回想一下,处于 Fréchet 分布并不意味着 image.png , 和 image.png , 但意味着

image.png

对于一些缓慢变化的函数 image.png ,不一定恒定!为了了解可能发生的情况,我们必须稍微具体一些。这只能通过查看生存函数的性质。假设,这里有一些辅助函数 image.png

image.png

这个(正)常数 image.png 以某种方式与生存函数与幂函数之比的收敛速度有关。

更具体地说,假设

image.png

然后,使用获得二阶正则变化性质 image.png ,然后,如果 image.png 趋向于无穷大太快,那么估计就会有偏差。 如果 image.png ,那么,对于一些 image.png ,

image.png

这个结果的直观解释是,如果 image.png 太大,并且如果基础分布不_完全_ 是帕累托分布,那么希尔估计量是有偏的。这就是我们所说的意思

  • 如果 image.png 太大, image.png 是有偏估计量
  • 如果 image.png 太小, image.png 是一个不稳定的估计量

(后者来自样本均值的属性:观察越多,均值的波动性越小)。

让我们运行一些模拟以更好地了解正在发生的事情。使用前面的代码,生成具有生存函数的随机样本实际上是极其简单的

image.png

> Q=function(p){uniroot(function(x) S(x)-(1-p)}

如果我们使用上面的代码。

希尔hill变成

> abline(h=alpha)

image.png

但它仅基于一个样本。再次考虑数千个样本,让我们看看 Hill 统计量如何,

image.png

所以这些估计量的(经验)平均值是

image.png

相关文章
|
9天前
|
数据可视化 数据挖掘 API
【R语言实战】聚类分析及可视化
【R语言实战】聚类分析及可视化
|
9天前
|
Web App开发 数据可视化 数据挖掘
利用R语言进行聚类分析实战(数据+代码+可视化+详细分析)
利用R语言进行聚类分析实战(数据+代码+可视化+详细分析)
|
9天前
|
数据采集 数据可视化
利用R语言进行因子分析实战(数据+代码+可视化+详细分析)
利用R语言进行因子分析实战(数据+代码+可视化+详细分析)
|
9天前
|
移动开发 数据可视化
广义线性模型beta二项分布的淋巴结疾病风险预测可视化R语言2实例合集|附数据代码
广义线性模型beta二项分布的淋巴结疾病风险预测可视化R语言2实例合集|附数据代码
|
9天前
|
机器学习/深度学习 数据可视化
R语言逻辑回归logistic模型ROC曲线可视化分析2例:麻醉剂用量影响、汽车购买行为2
R语言逻辑回归logistic模型ROC曲线可视化分析2例:麻醉剂用量影响、汽车购买行为
|
9天前
利用R语言进行典型相关分析实战
利用R语言进行典型相关分析实战
|
9天前
|
机器学习/深度学习 算法
R语言分类回归分析考研热现象分析与考研意愿价值变现
R语言分类回归分析考研热现象分析与考研意愿价值变现
|
9天前
|
数据可视化 定位技术
R语言贝叶斯INLA空间自相关、混合效应、季节空间模型、SPDE、时空分析野生动物数据可视化
R语言贝叶斯INLA空间自相关、混合效应、季节空间模型、SPDE、时空分析野生动物数据可视化
|
9天前
|
机器学习/深度学习 数据可视化 算法
R语言逻辑回归logistic模型ROC曲线可视化分析2例:麻醉剂用量影响、汽车购买行为1
R语言逻辑回归logistic模型ROC曲线可视化分析2例:麻醉剂用量影响、汽车购买行为
|
9天前
|
机器学习/深度学习 数据可视化 算法
R语言聚类分析、因子分析、主成分分析PCA农村农业相关经济指标数据可视化|数据分享
R语言聚类分析、因子分析、主成分分析PCA农村农业相关经济指标数据可视化|数据分享

热门文章

最新文章