开发者学堂课程【人工智能必备基础:概率论与数理统计:正太分布】学习笔记,与课程紧密联系,让用户快速学习知识。
课程地址:https://developer.aliyun.com/learning/course/545/detail/7422
正太分布
一、正态分布
1.正态分布代表了宇宙中大多数情况的运转状态,大量的随机变量被证明是正态分布的。
2.若随机变量X服从一个数学期望为 μ、方差为 σ^2 的正态分布,记为 N(μ,σ^2),其概率密度函数为正态分布的期望值 μ 决定了其位置,其标准差 σ 决定了分布的幅度。
当 μ = 0,σ = 1 时的正态分布是标准正态分布。
公式:
μ 为均值
σ 为标准差
3.导入工具包进行图形描绘
//密度函数
plt.plot(np.linspace(-4、4,100),
stats.norm.pdf(np.linspace(-4,4,100))/ np.max(stats.norm.pdf(np.linspace(-3,3,100)))
plt.fill_between(np.linspace(-4,4100).
stats.norm.pdf(np.linspace(-4,4,100))/np.max(stats.normpdf(np.linspace(-3,3、100))),
alpha= 15,
)
浮动范围小的可能性比较大
浮动范围大的可能性比较小
4.累积概率密度函数
//把当前结果一步一步的累积起来
# CDF
plt.plot(np.linspace(-4,4,100),
stats.norm.cdf(np.1inspace(-4,4,100)),
)
#TITLE
//指定范围
plt.text(x=-5,y=1.25,s=Normal Distribution - Overview".
fontsize = 26,weight ='bold’, alpha=75)
plt.text(x=-5,y=1.1,
s = 'Depicted below are the normed probability density function (pdf) and the cumulative densityinfunction (edf) of a nonml! fontsize = 19,alpha=.85)
默认参数
μ =0
σ =1
5.对于不同的 μ 值,表示均值不同,表示图像会左右平移
6.标准差
σ 意味着偏离程度的多少,值不同会影响它的波动范围,标准差越大,偏离均值会更大一些
随机的几个样本
可以使用 norm.rvs() 其中默认值 u=0,σ =1,也可以自己指定
In [4]: from scipy.stats import norm
# draw a single sample
print(norm.rvs(size=10),end="\n\n”)
#draw 10 samples
print(normrvs(size=10)end="\n\n")
# adjust mean (‘loc' and standard deviation (‘scale’)
print(norm.rvs(loc=10,scale=0.1),end="\n\n")
1.64481357445
[1.33252376 219487398 -0 12095854 -032972838 -1 4700231
0.71786462
0.30895492 -0.56507026 11402687 084654161]
9.95033612669
概率密度函数
直接 norm.pdf
7.用累积概率密度计算实际值
累积概率密度函数( Cumulative Probability Density Function )
Format(norm.cdf())
In [6]: from scipy.stats import norm
# probability of x less or equal 0.3
print("P(X<0.3)={}".format(norm.cdf(0.3)))
# probability of x in [-0.2,-0.2]
print("p(-0.2<x<0.2) = {}".format(norm.cdf(0.2)-norm.cdf(-0.2))) P(X<0.3)=0.6179114221889526
P(-0.2<X<0.2)=0.15851941887820603
8.基于数据画出分布
先用柱形图画出来,再用真实的概率分布描述出来,发现两者之间是重合的