六、数学期望与方差
6.1 期望
🚩这个在学概率论的时候同学们都是学过的,这是核心概念之一。什么是数学期望,从均值开始看起:
这里的1/n可以看作是每个样本x的权重,或者叫概率,如果把它替换称概率pi就得到了我们的数学期望。
说白了,对于离散型的随机变量而言,数学期望就是概率意义的平均值。
对于连续型的随机变量,把它推广一下变成定积分,求一个广义积分就是数学期望。
import numpy as np import matplotlib.pyplot as plt from scipy import integrate def f(x, sigma, u):# 概率密度 return 1 / (np.sqrt(2 * np.pi) * sigma) * np.exp(-(x - u) ** 2 / (2 * sigma ** 2)) x = np.linspace(-10, 10, 300) y = f(x, 2, -5) # 标准差是2,平均值是2.5 plt.plot(x, y) # 计算数学期望函数 def E(x, sigma, u): return x * f(x, sigma, u) print('不定积分计算正太分布数学期望:', np.round(integrate.quad(E, -100, 100, args = (2, -5))[0], 1))
6.2 方差
🚩方差反应的数据的波动程度的,就是它和均值,我们的数学期望偏离程度的平均。这里每个数据减去期望的平方,不平方的话正负抵消掉了,然后再乘以P概率值
离散性随机变量:
# 离散型随机变量 import numpy as np X = np.random.randint(-10, 10, size = 20) display(X) print('Numpy库提供的函数计算方差:%0.2f' % (np.var(X))) # X.mean为期望 var = ((X - X.mean()) ** 2).sum() / 20 print('根据公式计算的方差为:%0.2f' % (var))
连续型随机变量:
# 连续型随机变量的方差 import numpy as np import matplotlib.pyplot as plt from scipy import integrate def f(x, sigma, u): # 概率密度函数 return 1 / (np.sqrt(2 * np.pi) * sigma) * np.exp(-(x - u) ** 2 / (2 * sigma ** 2)) x = np.linspace(-10, 10, 300) y = f(x, 2, 2.5) # 标准差是2,均值(期望)是2.5 plt.plot(x, y) # 计算数学方差函数 def D(x, sigma, u): return (x - 2.5) ** 2 * f(x, sigma, u) print('不定积分计算正太分布方差是:', np.round(integrate.quad(D, -5, 10, args = (2, 2.5))[0], 1)) # 标准差的平方,就是方差
6.3 重要公式
上式中的(x−E(x))2化简如下。利用数学期望的线性性质:
这是求方差时非常常用的一个公式!
七、随机向量
🚩线性代数中,我们把标量 x 推广到向量,就是它有多个分量。
同样我们把单个随机变量可以推广到随机向量,就是它有多个分量,这样就有了随机向量的概念了,这是很自然的延申。
离散型的随机向量向量 X 取某一个具体的值为向量 X i ,然后取每一个向量值的概率都大于等于 0 ,所有的概率加起来要等于 1 ,符合这两个约束条件就可以了。
连续型的随机向量,它是用 0 和概率密度函数来描述的,n 重积分等于 1,相当于体积等于 1。
下面是二维的随机向量:
八、随机变量独立性
🚩两个随机变量如果相互独立的话,它们的联合概率密度函数等于它们的分别的概率密度函数乘积推广到多个随机变量相互独立
这和随机事件的形式上是统一的,f(x)换成符号p(x)就可以了。