如何区分统计学中的概率与频率

简介: 如何区分统计学中的概率与频率

1 频率


某个事件出现的次数除以总的次数、


从上面那句话,不难发现频率是通过已知的某个具体事件来得出结果。


2 概率


刻画随机事件发生的可能性大小的指标,概率的取值介于0~1之间


概率是基于大数定律得出,根据经验的频率,我们将其作为在未来一次试验中可能发生某一事件的概率。


3 两者的区别与联系


概率是理想值,频率是实验值;例如抛理想均等硬币10000次正反面出现正面的频率是0.5-+, 其 中 ,其中,其中表示误差,然而由大数定律可以证明当频率减去概率的模小于任意正数的时候可以认为在无穷多次实验中的频率值无限收敛与概率值;可以说大数定律是现实和理论的一个纽带,一个桥梁;所以当且仅当实验次数很大时频率和概率可以同台而舞,这就是频率和概率的本质差别


概率和频率的关系是:通过经验频率我们得到在未来发生某一事件的可能性概率。所以如果我们能够得到事件发生的频率,那么就可以预估在相同条件下,事件在未来的一次中发生的概率。


相关链接:

1 为什么很多人都不能区分“概率”和“频率”? - 知乎 (zhihu.com)

2 大数定理的通俗理解(辛钦、伯努利、切比雪夫大数定理) - 知乎 (zhihu.com)

3 概率与频率 - 搜索结果 - 知乎 (zhihu.com)

目录
相关文章
|
6天前
【数理统计实验(一)】统计量近似分布的随机模拟
【数理统计实验(一)】统计量近似分布的随机模拟
|
6天前
R语言用GAM广义相加模型研究公交专用道对行程时间变异度数据的影响
R语言用GAM广义相加模型研究公交专用道对行程时间变异度数据的影响
|
6天前
|
算法 vr&ar Python
R语言隐马尔可夫模型HMM连续序列重要性重抽样CSIR估计随机波动率模型SV分析股票收益率时间序列
R语言隐马尔可夫模型HMM连续序列重要性重抽样CSIR估计随机波动率模型SV分析股票收益率时间序列
|
6天前
|
Windows
R语言有状态依赖强度的非线性、多变量跳跃扩散过程模型似然推断分析股票价格波动
R语言有状态依赖强度的非线性、多变量跳跃扩散过程模型似然推断分析股票价格波动
|
6天前
|
机器学习/深度学习 TensorFlow 定位技术
神经网络学习率指数衰减ExponentialDecay策略的参数含义与使用方法详解
神经网络学习率指数衰减ExponentialDecay策略的参数含义与使用方法详解
|
8月前
第8章 概率统计——8.4 统计特征
第8章 概率统计——8.4 统计特征
|
10月前
|
传感器
【状态估计】用于非标量系统估计的最优卡尔曼滤波(Matlab代码实现)
【状态估计】用于非标量系统估计的最优卡尔曼滤波(Matlab代码实现)
|
资源调度 算法 关系型数据库
概率图推断之变量消除算法
事实证明,推理是一项颇具挑战的任务。对于很多我们感兴趣的概率,要准确回答这些问题都是NP难题。至关重要的是,推理是否容易处理取决于描述概率的图的结构。尽管有些问题很难解决,我们仍然可以通过近似推理方法获得有用的答案。
194 0
概率图推断之变量消除算法
|
PyTorch 算法框架/工具
torch 如何实现两点分布采样,要求采100个样本,其中20个样本为数字1,80个为数字2
可以使用 PyTorch 中的 torch.distributions 模块实现两点分布采样。具体来说,可以使用 Categorical 分布将数字1和数字2的概率分别设为0.2和0.8,然后调用 sample() 方法进行采样。可以先使用 torch.ones() 和 torch.zeros() 函数生成分别包含20个数字1和80个数字2的张量,然后使用 torch.cat() 函数将它们拼接在一起,再使用 torch.randperm() 函数对其进行打乱。
283 0
|
数据安全/隐私保护
DetectGPT:使用概率曲率的零样本机器生成文本检测
DetectGPT的目的是确定一段文本是否由特定的llm生成,例如GPT-3。为了对段落 x 进行分类,DetectGPT 首先使用通用的预训练模型(例如 T5)对段落 ~xi 生成较小的扰动。然后DetectGPT将原始样本x的对数概率与每个扰动样本~xi进行比较。如果平均对数比高,则样本可能来自源模型。
216 0