正太分布 | 学习笔记

简介: 快速学习正太分布

开发者学堂课程【人工智能必备基础:概率论与数理统计:正太分布】学习笔记,与课程紧密联系,让用户快速学习知识。

课程地址:https://developer.aliyun.com/learning/course/545/detail/7422


正太分布

一、正态分布

1.正态分布代表了宇宙中大多数情况的运转状态,大量的随机变量被证明是正态分布的。

2.若随机变量X服从一个数学期望为 μ、方差为 σ^2 的正态分布,记为 N(μ,σ^2),其概率密度函数为正态分布的期望值 μ 决定了其位置,其标准差 σ 决定了分布的幅度。

当 μ = 0,σ = 1 时的正态分布是标准正态分布。

公式:

image.png 

μ 为均值

σ 为标准差

3.导入工具包进行图形描绘

#PDF

//密度函数

plt.plot(np.linspace(-4、4,100),

stats.norm.pdf(np.linspace(-4,4,100))/ np.max(stats.norm.pdf(np.linspace(-3,3,100)))

plt.fill_between(np.linspace(-4,4100).stats.norm.pdf(np.linspace(-4,4,100))/np.max(stats.normpdf(np.linspace(-3,3、100))),

alpha= 15,

)

image.png

浮动范围小的可能性比较大

浮动范围大的可能性比较小

4.累积概率密度函数

//把当前结果一步一步的累积起来

# CDF

plt.plot(np.linspace(-4,4,100),

stats.norm.cdf(np.1inspace(-4,4,100)),

#TITLE

//指定范围

plt.text(x=-5,y=1.25,s=Normal Distribution - Overview".

fontsize = 26,weight ='bold’, alpha=75)

plt.text(x=-5,y=1.1,

s = 'Depicted below are the normed probability density function (pdf) and the cumulative densityinfunction (edf) of a nonml! fontsize = 19,alpha=.85)

默认参数

μ =0

σ =1

5.对于不同的 μ 值,表示均值不同,表示图像会左右平移

image.png

6.标准差

σ 意味着偏离程度的多少,值不同会影响它的波动范围,标准差越大,偏离均值会更大一些

image.png

随机的几个样本

可以使用 norm.rvs() 其中默认值 u=0,σ =1,也可以自己指定

In [4]: from scipy.stats import norm

# draw a single sample

print(norm.rvs(size=10),end="\n\n”)

#draw 10  samples

print(normrvs(size=10)end="\n\n")

# adjust mean (‘loc' and standard deviation (‘scale’)

print(norm.rvs(loc=10,scale=0.1),end="\n\n")

1.64481357445

[1.33252376 219487398 -0 12095854 -032972838 -1 4700231

0.71786462

0.30895492 -0.56507026 11402687 084654161]

9.95033612669

概率密度函数

直接 norm.pdf

image.png

7.用累积概率密度计算实际值

累积概率密度函数( Cumulative Probability Density Function )

Format(norm.cdf())

In [6]: from scipy.stats import norm

# probability of x less or equal 0.3

print("P(X<0.3)={}".format(norm.cdf(0.3)))

# probability of x in [-0.2,-0.2]

print("p(-0.2<x<0.2) = {}".format(norm.cdf(0.2)-norm.cdf(-0.2))) P(X<0.3)=0.6179114221889526

P(-0.2<X<0.2)=0.15851941887820603

8.基于数据画出分布

先用柱形图画出来,再用真实的概率分布描述出来,发现两者之间是重合的

image.png

相关文章
|
6月前
|
机器学习/深度学习 监控 数据挖掘
数据并非都是正态分布:三种常见的统计分布及其应用
这篇文章除了介绍线性模型在减肥app预测中的不切实际性,还探讨了不同统计分布在体重管理和数据分析中的应用。文章提到了正态分布和泊松分布,前者常用于描述围绕平均值对称分布的连续数据,如体重;后者适合计数数据,如体重变化次数。正态分布以其钟形曲线闻名,泊松分布则描述独立事件的数量。文章还简要介绍了卡方分布在检验分类变量关系时的作用。最后,文章指出了在线性回归中假设数据正态分布的原因,包括便于统计推断和最小化估计误差。
566 5
|
7月前
|
数据可视化
【R语言实战】——金融时序分布拟合
【R语言实战】——金融时序分布拟合
【数理统计实验(一)】统计量近似分布的随机模拟
【数理统计实验(一)】统计量近似分布的随机模拟
技术心得记录:概率统计13——二项分布与多项分布
技术心得记录:概率统计13——二项分布与多项分布
|
6月前
|
自然语言处理 数据可视化 Python
卡方分布和 Zipf 分布模拟及 Seaborn 可视化教程
卡方分布是统计学中的一种连续概率分布,用于假设检验,形状由自由度(df)决定。自由度越大,分布越平缓。NumPy的`random.chisquare()`可生成卡方分布随机数。Seaborn能可视化卡方分布。练习包括模拟不同自由度的卡方分布、进行卡方检验。瑞利分布描述信号处理中幅度分布,参数为尺度(scale)。Zipf分布常用于自然语言等幂律特征数据,参数a控制形状。NumPy的`random.zipf()`生成Zipf分布随机数。
121 0
|
7月前
|
数据挖掘
统计的基本概念及抽样分布
统计的基本概念及抽样分布
统计的基本概念及抽样分布
三大抽样分布——卡方分布、t分布、F分布
三大抽样分布——卡方分布、t分布、F分布
05 离散·连续·多维随机变量及其分布 - 概念点
05 离散·连续·多维随机变量及其分布 - 概念点
60 0
|
机器学习/深度学习 人工智能 开发者
二项式分布 | 学习笔记
快速学习二项式分布
二项式分布 | 学习笔记