《计算机视觉:模型、学习和推理》一2.1 随机变量-阿里云开发者社区

开发者社区> 华章出版社> 正文

《计算机视觉:模型、学习和推理》一2.1 随机变量

简介: 本节书摘来华章计算机《计算机视觉:模型、学习和推理》一书中的第2章 ,第2.1节, [英]西蒙J. D. 普林斯(Simon J. D. Prince)著苗启广 刘凯 孔韦韦 许鹏飞 译 译更多章节内容可以访问云栖社区“华章计算机”公众号查看。

第2章

概 率 概 述

本章简要回顾概率论。这些知识相对简单而且彼此独立。然而,它们结合在一起构成了一种描述不确定性的强大语言。

2.1 随机变量

随机变量x表示一个不确定的数量。该变量可以表示一个实验的结果(例如,抛硬币)或波动特性的真实量度(例如,测量温度)。如果我们观察几个实例{xi}Ii=1,它可能在每一个场合取不同的值。然而,一些值可能比其他值更容易出现。这种信息是由随机变量的概率分布Pr(x)决定的。
随机变量可以是离散的或连续的。离散变量从一组预先确定的集合中取值。这组值可能是有序的(掷骰子的点数从1到6)或者无序的(观察天气的结果是“晴”、“下雨”或“下雪”)。它可能是有限的(从标准扑克牌中随机抽出一张牌,有52种可能的结果)或者无限的(从理论上说,下一班火车上的人数是无限的)。离散变量的概率分布可以可视化为一个直方图或Hinton图(见图2-1)。每个结果都有一个与之相关的正概率,且所有结果的概率之和总是1。
2017_09_19_103501

图2-1 离散概率的两种不同表示。a) 表示不均匀六面的骰子每一面落在地上的柱状图。因为柱状图中柱子的高度代表每面的概率,所以所有的高度和为1。b) 表示观察到英国不同天气类型概率的Hinton图。因为方形区域的面积表示每种天气出现的概率,所以所有的面积之和为1
 图2-2 连续概率分布(概率密度函数或简称PDF),即完成测试所需的时间。注意,概率密度可超过1,但曲线下的面积必须始终是单位面积连续随机变量取实数值。这些取值可能是有限的(要完成时长两小时考试所花费时间是介于0~2小时之间的)或无限的(下一班车到达的时间是无上界的实数)。无限连续变量可能取遍整个实数范围,或者可能是仅有上界或下界的区间(车辆的速度能够取任意值,但速率的下界为0)。连续变量的概率分布可以通过绘制概率密度函数(PDF)来可视化。一个结果的概率密度表示随机变量取该值的相对可能性(见图2-2)。它可以取任何正值。然而,PDF的积分总是1。

2017_09_19_104004

版权声明:本文内容由阿里云实名注册用户自发贡献,版权归原作者所有,阿里云开发者社区不拥有其著作权,亦不承担相应法律责任。具体规则请查看《阿里云开发者社区用户服务协议》和《阿里云开发者社区知识产权保护指引》。如果您发现本社区中有涉嫌抄袭的内容,填写侵权投诉表单进行举报,一经查实,本社区将立刻删除涉嫌侵权内容。

分享:

华章出版社

官方博客
官网链接