gamma函数及相关其分布

简介: 神奇的gamma函数(上)神奇的gamma函数(下)gamma函数的定义及重要性质\[\Gamma(x)=\int_0^{\infty}t^{x-1}e^{-t}dt\]\[\Gamma(x+1) = x \Gamma(x)\]\[\Gamma(n) = (n-1)! \]\[\Gamma(0) = 1\]\[\Gamma({1\over 2}) = 2\int_0^{+\infty}e^{-u^2}du = \sqrt\pi\]gamma函数的图像在matlib中,我们可以方便的用下面的代码画出gamma函数的图像。

gamma函数的定义及重要性质

\[\Gamma(x)=\int_0^{\infty}t^{x-1}e^{-t}dt\]

\[\Gamma(x+1) = x \Gamma(x)\]
\[\Gamma(n) = (n-1)! \]
\[\Gamma(0) = 1\]
\[\Gamma({1\over 2}) = 2\int_0^{+\infty}e^{-u^2}du = \sqrt\pi\]

gamma函数的图像

在matlib中,我们可以方便的用下面的代码画出gamma函数的图像。

x = -10:0.001:10;
plot(x,gamma(x));
axis([-10.1,10.1,-4,4]);

image

随机变量\(Y=X^2\)的概率密度

假设随机变量\(X\)具有概率密度\(f_X(x),-\infty

\begin{align*}F_Y(y) &=P(Y\leq y)=P(X^2 \leq y) \\
        &=P(-\sqrt{y} \leq x \leq \sqrt{y}) \\ &=F_X(\sqrt{y})-F_X{(-\sqrt{y})}  \end{align*}

\[f_Y(y)=\left\{
\begin{aligned}
\frac{1}{2\sqrt{y}}[f_X(\sqrt{y})+f_X(\sqrt{-y}], y >0, \\
  0, y \leq 0 \\
\end{aligned}
\right.\]

设\(X \sim  N(0,1)\),其概率密度为\(\varphi(x)=\frac{1}{\sqrt{2\pi}}e^{\frac{-x^2}{2}}, -\infty

\[f_Y(y)=\left\{
\begin{aligned}
\frac{1}{\sqrt{2\pi}}y^{-1/2}e^{-y/2}, y>0, \\
  0, y \leq 0 \\
\end{aligned}
\right.\]

Gamma分布

\(X \sim \Gamma(\alpha, \theta)\)

\[f_X(x)=\left\{
  \begin{aligned}
  \frac{1}{\theta^\alpha\Gamma(\alpha)}x^{\alpha-1}e^{-x/\theta}, x> 0, \alpha>0,\theta>0 \\
   0, x \leq 0, \alpha>0,\theta>0 \\
  \end{aligned}
  \right.\]

当\(\alpha= 1 , \theta = \lambda 时,\Gamma(1,\lambda)\) 就是参数为\(\lambda\)的指数分布,记为\(exp (\lambda)\) ;

当\(\alpha= n/2 , \theta = 2 时,\Gamma(n/2,1/2)\)就是数理统计中常用的\(\chi^2(n)\) 分布。

数学期望(均值)、方差分别为

\[E(X) = \alpha\theta\]

\[D(x) = \alpha\theta^2\]

Gamma分布是指在地震序列的有序性、地震发生率的齐次性、计数特征具有独立增量和平稳增量情况下,可以导出地震发生\(i\)次时间的概率密度为Gamma密度函数。

gamma分布的一个重要应用就是作为共轭分布出现在很多机器学习算法中。

gamma的密度函数和分布函数图像如下:

注意:这儿\(\alpha=1.5,\theta = 1/0.6 或者 \beta=0.6\),因为gamma函数有两种表达方式,一种用\(\theta\),一种用\(\beta\),它们的关系是\(\theta=\frac{1}{\beta}\)

x=0:0.1:5;
figure;
plot(x,[gampdf(x,1.5,0.6);gamcdf(x,1.5,0.6)])

image


Gamma分布的可加性

设\(X \sim \Gamma(\alpha, \theta),Y \sim \Gamma(\beta,\theta)\),\(X,Y\)的概率密度如下:

\[f_X(x)=\left\{
  \begin{aligned}
  \frac{1}{\theta^\alpha\Gamma(\alpha)}x^{\alpha-1}e^{-x/\theta}, x> 0, \alpha>0,\theta>0 \\
   0, x \leq 0, \alpha>0,\theta>0 \\
  \end{aligned}
  \right.\]

\[f_Y(y)=\left\{
  \begin{aligned}
  \frac{1}{\theta^\beta\Gamma(\beta)}y^{\beta-1}e^{-y/\theta}, y > 0, \beta>0,\theta>0 \\
   0, y \leq 0, \beta>0,\theta>0\\
  \end{aligned}
  \right.\]

则有\(Z=X+Y\)的分布为:\(X+Y \sim \Gamma(\alpha + \beta,\theta)\)

\(\chi ^2\)(卡方)分布及其性质

设\(X_1,X_2,…,X_n\)是来自总体\(N(0,1)\)的样本,则称统计量

\[\chi^2=X_1^2+X_2^2+…+X_n^2\]

为服从自由度为\(n\)的\(\chi^2\)分布,记为\(\chi^2 \sim \chi^2(n)\)

它的概率密度函数为:

\[f(x,n)=\left\{
  \begin{aligned}
  \frac{1}{2^{n/2}\Gamma(n/2)}x^{n/2-1}e^{-x/2}, x> 0 \\
   0, x \leq 0,  \\
  \end{aligned}
  \right.\]

用下面的matlib代码,我们能够画出卡方分布概率密度函数图:

%卡方分布
x=0.0:0.01:30;
y=chi2pdf(x,1);
y1=chi2pdf(x,2);
y2=chi2pdf(x,4);
y3=chi2pdf(x,6);
y4=chi2pdf(x,11);
plot(x,y,'-r',x,y1,'-g',x,y2,'-b',x,y3,'-c',x,y4,'-m');
legend('自由度1','自由度2','自由度4','自由度6','自由度11');
axis([0,30,0,0.2]);
View Code

image

由上面的式子可以知道:

\[\chi^2=\sum\limits_{i=1}^{n}X_i^2 \sim \Gamma(\frac{n}{2},2)\]

1)若 \(X \sim \chi(n)\),则\(E(X)=n,D(X)=2n\)

2)若\(X \sim \chi(n_1)\), \(Y \sim \chi(n_2)\),且\(X,Y\)相互对立,则有\(X+Y \sim \chi^2(n_1+n_2)\)

相关文章
|
7月前
样条曲线分段线性回归模型piecewise regression估计个股beta值分析收益率数据
样条曲线分段线性回归模型piecewise regression估计个股beta值分析收益率数据
|
机器学习/深度学习 Linux Python
如何知道一个变量的分布是否为高斯分布?
如何知道一个变量的分布是否为高斯分布?
206 0
如何知道一个变量的分布是否为高斯分布?
多变的夏普率二---正态分布约束下的样本的标准差是无偏估计?
多变的夏普率二---正态分布约束下的样本的标准差是无偏估计?
84 0
多变的夏普率二---正态分布约束下的样本的标准差是无偏估计?
|
机器学习/深度学习 容器
L2-离散变量分布:Bernoulli分布、二项分布、泊松分布等
L2-离散变量分布:Bernoulli分布、二项分布、泊松分布等
L2-离散变量分布:Bernoulli分布、二项分布、泊松分布等
|
C#
利用最小二乘法拟合任意次函数曲线(C#)
原文:利用最小二乘法拟合任意次函数曲线(C#) ///     ///用最小二乘法拟合二元多次曲线     ///     ///已知点的x坐标集合     ///已知点的y坐标集合     ///已知点的个数     ///方程的最高次数     ...
3130 0