本节书摘来自华章计算机《计算机视觉:模型、学习和推理》一书中的第2章,第2.1节,作者:(英)普林斯(Prince,J. D.)著, 更多章节内容可以访问云栖社区“华章计算机”公众号查看。
第2章 概率概述
本章简要回顾概率论。这些知识相对简单而且彼此独立。然而,它们结合在一起构成了一种描述不确定性的强大语言。
2.1 随机变量
随机变量x表示一个不确定的数量。该变量可以表示一个实验的结果(例如,抛硬币)或波动特性的真实量度(例如,测量温度)。如果我们观察几个实例{xi}Ii=1,它可能在每一个场合取不同的值。然而,一些值可能比其他值更容易出现。这种信息是由随机变量的概率分布Pr(x)决定的。
随机变量可以是离散的或连续的。离散变量从一组预先确定的集合中取值。这组值可能是有序的(掷骰子的点数从1到6)或者无序的(观察天气的结果是“晴”、“下雨”或“下雪”)。它可能是有限的(从标准扑克牌中随机抽出一张牌,有52种可能的结果)或者无限的(从理论上说,下一班火车上的人数是无限的)。离散变量的概率分布可以可视化为一个直方图或Hinton图(见图2-1)。每个结果都有一个与之相关的正概率,且所有结果的概率之和总是1。
图2-1 离散概率的两种不同表示。a) 表示不均匀六面的骰子每一面落在地上的柱状图。因为柱状图中柱子的高度代表每面的概率,所以所有的高度和为1。b) 表示观察到英国不同天气类型概率的Hinton图。因为方形区域的面积表示每种天气出现的概率,所以所有的面积之和为1
图2-2 连续概率分布(概率密度函数或简称PDF),即完成测试所需的时间。注意,概率密度可超过1,但曲线下的面积必须始终是单位面积连续随机变量取实数值。这些取值可能是有限的(要完成时长两小时考试所花费时间是介于0~2小时之间的)或无限的(下一班车到达的时间是无上界的实数)。无限连续变量可能取遍整个实数范围,或者可能是仅有上界或下界的区间(车辆的速度能够取任意值,但速率的下界为0)。连续变量的概率分布可以通过绘制概率密度函数(PDF)来可视化。一个结果的概率密度表示随机变量取该值的相对可能性(见图2-2)。它可以取任何正值。然而,PDF的积分总是1。