在保险业中,由于分散投资,通常会在合法的大型投资组合中提及大数定律。在一定时期内,损失“可预测”。当然,在标准的统计假设下,即有限的期望值和独立性。由于在保险业中,灾难通常很少发生,而且代价非常高昂,精算师可能有兴趣对少量事件的发生进行建模。背后的定理有时也被称为小数定律。
泊松分布
所谓的泊松分布(请参阅http://en.wikipedia.org/…)由SiméonPoisson于1837年进行了介绍。亚伯拉罕·德·莫伊夫(Abraham De Moivre)于1711年在De Mensura Sortis seu对其进行了定义。
如果考虑大量观察值,并且计算给定(小)区域中有多少观察值,则此类观察值的数量就是泊松分布。
n=1000 polygon(c(u,rev(u)),c(v,rev(-v)),col="yellow",border=NA) I=(X^2+Y^2)<1 points(X[I],Y[I],cex=.6,pch=19,col="red")
如果我们进行一些模拟
> n=1000 > ns=100000 > N=rep(NA,ns) > + + + + + > > mean(N) [1] 31.41257
泊松分布的参数是黄色圆盘的面积,即正方形的面积,即
> lines(0:60-.5,dpois(0:60,lambda),type="b",col="red")
泊松过程
如上所述,当事件以某种方式随机且独立地随时间发生时,就会出现泊松分布。然后很自然地研究两次事件之间的时间(或在保险范围内两次索赔)。
泊松分布和索赔发生
既不是SiméonPoisson也不是De Moivre,而是Ladislaus Von Bortkiewicz首先提到了Poisson分布是小数定律。1898年,他研究了1875年至1894年间被马踢倒杀死的士兵的人数,其中有200个兵团。
他确实获得了以下分布(此处,泊松分布的参数为0.61,即每年的平均死亡人数)
在很多情况下,泊松分布都非常适合。例如,如果我们考虑1850年后在佛罗里达州的飓风数量,
泊松分布和回归期
返回期是由Emil Gumbel在水文学中介绍的,用于链接概率和持续时间。十年事件的发生概率为1/10。那么10是发生之前的平均等待时间。这并不意味着该事件不会在10年之前发生,或者必须在10年之前发生,通常用下表来总结此属性,
上表中的对角线非常有趣。似乎在某种程度上趋向极限值(此处为63.2%)。在n年内观察到的事件数量具有二项式分布。那么,没有灾难的概率为0.632。
稀有概率与泊松分布
计算稀有事件的概率时,泊松分布不断出现。例如,在50年的时间里,至少有一次在核电厂发生事故的可能性。假设在反应堆中发生事故的年概率
很小,例如0.05%。
进一步假设反应堆在时间上相互独立。
> > [1] 0.1812733 > [1] 0.1812692
这是具有参数为的泊松分布时为零 的概率 。
解决这个问题的另一种方法是基于以下思想:鉴于在对全球450座反应堆进行的45年观察中(,观察到了三起重大事故,包括“三哩岛”(1979年)和“福岛”(2011年),即两次事故之间的平均时间估计为16年。对于单个反应堆,我们可以假设事件发生之前等待的平均时间是16年的450倍,即7200年。或者,一个反应堆在一年内发生一次事件的概率是7200以上的事件之一(这是“返还期”概念背后的想法)。如果我们假设事故的到来是随机且彼此独立发生的(如上定义),则在50年内观察到的重大事故数量遵循参数为50 /(7200/80)的泊松分布。
即
> [1] 0.4262466