开发者社区> 迈克老狼1> 正文

正态分布(高斯分布)

简介: http://songshuhui.net/archives/76501 http://songshuhui.net/archives/77386      正态分布(Normal distribution)又名高斯分布(Gaussian distribution),是一个在数学、物理及工程等领域都非常重要的概率分布,在统计学的许多方面有着重大的影响力。
+关注继续查看

http://songshuhui.net/archives/76501

http://songshuhui.net/archives/77386

     正态分布(Normal distribution)又名高斯分布(Gaussian distribution),是一个在数学、物理及工程等领域都非常重要的概率分布,在统计学的许多方面有着重大的影响力。

     正态分布是自然科学与行为科学中的定量现象的一个方便模型。各种各样的心理学测试分数和物理现象比如光子计数都被发现近似地服从正态分布。尽管这些现象的根本原因经常是未知的, 理论上可以证明如果把许多小作用加起来看做一个变量,那么这个变量服从正态分布(在R.N.Bracewell的Fourier transform and its application中可以找到一种简单的证明)。正态分布出现在许多区域统计:例如, 采样分布均值是近似地正态的,既使被采样的样本总体并不服从正态分布。另外,常态分布信息熵在所有的已知均值及方差的分布中最大,这使得它作为一种均值以及方差已知的分布的自然选择。正态分布是在统计以及许多统计测试中最广泛应用的一类分布。在概率论,正态分布是几种连续以及离散分布的极限分布。

     正态态分布最早是亚伯拉罕·棣莫弗在1734年发表的一篇关于二项分布文章中提出的。拉普拉斯在1812年发表的《分析概率论》(Theorie Analytique des Probabilites)中对棣莫佛的结论作了扩展。现在这一结论通常被称为棣莫佛-拉普拉斯定理。

    拉普拉斯在误差分析试验中使用了正态分布。勒让德于1805年引入最小二乘法这一重要方法;而高斯则宣称他早在1794年就使用了该方法,并通过假设误差服从正态分布给出了严格的证明。

     “钟形曲线”这个名字可以追溯到Jouffret他在1872年首次提出这个术语"钟形曲面",用来指代二元正态分布(bivariate normal)。正态分布这个名字还被Charles S. Peirce、Francis Galton、Wilhelm Lexis在1875分布独立的使用。这个术语是不幸的,因为它反应和鼓励了一种谬误,即很多概率分布都是正态的。


正态分布的定义


概率密度函数

四个不同参数集的概率密度函数(红色线代表标准正态分布)[图1]

正态分布的概率密度函数,其中均值为\(\mu\) ,方差为\(\sigma^2\):

\[f(x;\mu,\sigma)=\frac{1}{\sqrt{2\pi}\sigma}exp^{-\frac{(x-\mu)^2}{2\sigma^2}}\]

如果一个随机变量\(X\)服从这个分布,我们写作\(X \sim N(\mu,\sigma^2)\) 如果\(\mu = 0\)并且\(\sigma = 1\),这个分布被称为标准正态分布,这个分布能够简化为

\[f(x)=\frac{1}{\sqrt{2\pi}}exp^{-\frac{x^2}{2}}\]


x=-7:0.01:7;
y=normpdf(x,0,1);
plot(x,y,'-r');
grid on;
hold on;
plot(x,normpdf(x,0,0.6),'-b');
plot(x,normpdf(x,0,5.0),'-g');
plot(x,normpdf(x,-2,0.8),'-k');
legend('ex=0,var=1','ex=0,var=0.6','ex=0,var=5.0','ex=-2,var=1');

image

正态分布中一些值得注意的量:

  • 密度函数关于均值对称
  • 均值是它的众数(statistical mode)以及中位数(median)
  • 函数曲线下68.268949%的面积在平均值左右的一个标准差范围内
  • 95.449974%的面积在均值左右两个标准差2σ的范围内
  • 99.730020%的面积在均值左右三个标准差3σ的范围内
  • 99.993666%的面积在均值左右四个标准差4σ的范围内
  • 反曲点(inflection point)在离均值的距离为标准差之处
累积分布函数
x=-7:0.01:7;
y=normcdf(x,0,1);
plot(x,y,'-r');
grid on;
hold on;
plot(x,normcdf(x,0,0.6),'-b');
plot(x,normcdf(x,0,5.0),'-g');
plot(x,normcdf(x,-2,0.8),'-k');
legend('ex=0,var=1','ex=0,var=0.6','ex=0,var=5.0','ex=-2,var=1');

image

上图所示的是概率密度函数的累积分布函数,累积分布函数是指随机变量\(X\)小于或等于\(x\)的概率,用密度函数表示为

\[F(x;\mu,\sigma)=\frac{1}{\sqrt{2\pi}\sigma}\int_{-\infty}^xexp^{-\frac{(x-\mu)^2}{2\sigma^2}}dx\]

标准正态分布的累积分布函数习惯上记为\(\Phi\),它仅仅是指\(\mu = 0,\sigma = 1\)时的值

\[\Phi(x)=F(x;0,1)=\frac{1}{\sqrt{2\pi}}\int_{-\infty}^xexp^{-\frac{x^2}{2}}dx\]

正态分布的一些性质

  1. 如果\(X \sim N(\mu, \sigma^2)\)且\(a\)与\(b\)是实数,那么\(aX + b \sim N(a\mu + b,(a\sigma)^2)\)
  2. 如果\(X \sim N(\mu_X, \sigma_X^2)\)与\(Y \sim N(\mu_Y, \sigma_Y^2)\)是统计独立的正态随机变量,那么:
    • 它们的和也满足正态分布 . \(U=X+Y \sim  N(\mu_X+\mu_Y, \sigma_X^2+\sigma_Y^2)\)
    • 它们的差也满足正态分布. \(U=X-Y \sim  N(\mu_X-\mu_Y, \sigma_X^2+\sigma_Y^2)\)
    • UV两者是相互独立的。
  3. 期望:\(\mu\)
  4. 方差:\(\sigma^2\)


版权声明:本文内容由阿里云实名注册用户自发贡献,版权归原作者所有,阿里云开发者社区不拥有其著作权,亦不承担相应法律责任。具体规则请查看《阿里云开发者社区用户服务协议》和《阿里云开发者社区知识产权保护指引》。如果您发现本社区中有涉嫌抄袭的内容,填写侵权投诉表单进行举报,一经查实,本社区将立刻删除涉嫌侵权内容。

相关文章
使用SSH远程登录阿里云ECS服务器
远程连接服务器以及配置环境
10664 0
windows server 2008阿里云ECS服务器安全设置
最近我们Sinesafe安全公司在为客户使用阿里云ecs服务器做安全的过程中,发现服务器基础安全性都没有做。为了为站长们提供更加有效的安全基础解决方案,我们Sinesafe将对阿里云服务器win2008 系统进行基础安全部署实战过程! 比较重要的几部分 1.
11376 0
阿里云服务器如何登录?阿里云服务器的三种登录方法
购买阿里云ECS云服务器后如何登录?场景不同,大概有三种登录方式:
7646 0
如何设置阿里云服务器安全组?阿里云安全组规则详细解说
阿里云安全组设置详细图文教程(收藏起来) 阿里云服务器安全组设置规则分享,阿里云服务器安全组如何放行端口设置教程。阿里云会要求客户设置安全组,如果不设置,阿里云会指定默认的安全组。那么,这个安全组是什么呢?顾名思义,就是为了服务器安全设置的。安全组其实就是一个虚拟的防火墙,可以让用户从端口、IP的维度来筛选对应服务器的访问者,从而形成一个云上的安全域。
15568 0
阿里云服务器怎么设置密码?怎么停机?怎么重启服务器?
如果在创建实例时没有设置密码,或者密码丢失,您可以在控制台上重新设置实例的登录密码。本文仅描述如何在 ECS 管理控制台上修改实例登录密码。
18260 0
使用NAT网关轻松为单台云服务器设置多个公网IP
在应用中,有时会遇到用户询问如何使单台云服务器具备多个公网IP的问题。 具体如何操作呢,有了NAT网关这个也不是难题。
33694 0
阿里云服务器ECS远程登录用户名密码查询方法
阿里云服务器ECS远程连接登录输入用户名和密码,阿里云没有默认密码,如果购买时没设置需要先重置实例密码,Windows用户名是administrator,Linux账号是root,阿小云来详细说下阿里云服务器远程登录连接用户名和密码查询方法
19788 0
阿里云服务器如何登录?阿里云服务器的三种登录方法
购买阿里云ECS云服务器后如何登录?场景不同,阿里云优惠总结大概有三种登录方式: 登录到ECS云服务器控制台 在ECS云服务器控制台用户可以更改密码、更换系.
23610 0
+关注
迈克老狼1
算法相关技术专家
240
文章
0
问答
文章排行榜
最热
最新
相关电子书
更多
OceanBase 入门到实战教程
立即下载
阿里云图数据库GDB,加速开启“图智”未来.ppt
立即下载
实时数仓Hologres技术实战一本通2.0版(下)
立即下载