2.2 联合概率
假设两个随机变量x和y。若观察x和y的多个成对实例,结果中某些组合出现得较为频繁。这样的情况用x和y的联合概率分布表示,记作Pr(x,y)。在Pr(x,y)中的逗号可以理解为“和”,所以Pr(x,y)是x和y的概率。一个联合概率分布中的相关变量可能全是离散变量,或全是连续变量,抑或是兼而有之(见图2-3)。不管怎样,所有结果的概率之和(离散变量的总和与连续变量的积分)总是1。
图2-3 变量x和y的联合概率分布。a~c) 两个连续变量的概率密度函数分别呈现为曲面图、等值线图和图像。d) 表示两个离散变量联合概率分布的二维Hinton图。e) 表示连续变量x和离散变量y的联合概率分布。f) 表示离散变量x与连续变量y的联合概率分布
一般来说,与二元变量的概率分布相比,我们会对多元变量的联合概率分布更感兴趣。我们将Pr(x,y,z)记为标量变量x、y和z的联合概率分布,也可以把Pr(x)当成所有多维元素x=[x1,x2,…,xk]T的联合概率。最后,我们用Pr(x,y)表示所有多维变量x、y的联合概率分布。