0. 写在前面
这些问题是我备考概率论过程中,详细总结的常见面试问题和答案。逐个搜索并记录下来,花了很大的精力!
1. 变量和随机变量的区别?
随机变量的取值是随时无规则变化的,普通变量在确定条件下值是确定的。随机变量的值不能预知,具有不确定性。
随机变量是指 随机事件 的数量表现,随机变量分为离散变量以及连续变量
2. 随机变量和概率分布的关系?
随机变量函数可以用来模拟概率事件
什么是概率?
是对事件发生的可能性大小的度量;
一个介于0和1之间的一个值;
事件A的概率记为P(A)
3. 联合概率和边缘概率 ?
联合概率指的是包含多个条件且所有条件同时成立的概率,记作P(X=a,Y=b)或P(a,b)。
边缘概率是与联合概率对应的,P(X=a)或P(Y=b),这类仅与单个随机变量有关的概率称为边缘概率。
4. 贝叶斯公式
贝叶斯公式解决的是一些原因X无法直接观测、测量,而我们希望通过其结果Y来反推出原因X的问题
5. 常见的概率分布和应用场景?
https://blog.csdn.net/qq_55168827/article/details/124355136
6. 正态分布的性质
两个正态分布相加减后,仍然是正态分布。
比方说X服从N(a,b),Y服从N(c,d),
那么X+Y服从N(a+c,b+d)X-Y服从N(a-c,b+d)。
相乘是卡方分布,卡方分布可以检验模型适配性和变量独立性等等
7. 什么是假设和检验
假设检验是统计推断的一个重要内容,用于判断某个假设是否正确
假设检验=显著性水平+小概率思想+反证法
它以较小的风险来判断估计数值与总体数值(或者估计分布与实际分布)是否存在显著差异,是否应当接受原假设选择的一种检验方法
8. 独立和不相关的区别
独立是指变量之间完全没有关系,但是不相关则仅要求变量之间没有线性关系,因而独立的要求更高,独立的变量一定是不相关的,但是不相关的不一定是独立的,即独立是不相关的充分不必要条件
9. 概率密度函数?
1.f(x)总是≥0
2.从负无穷到正无穷对f(x)积分面积始终为1
10. 泊松分布的例子
当一个事件的发生满足以下条件时,可以认为这个事件在某一固定时间段内的发生次数满足柏松分布。
1.事件是独立发生的
2.事件发生的概率在给定的固定时间内不随时间变化
也就是随机独立发生,x表示一段时间内事件发生的次数,λ表示一段时间内事件发生的平均次数。
11. 相关系数和协方差
协方差为0说明两个变量是不相关的。
相关系数为0说明为 协方差/XY的标准差,协方差也为0
12. 如何抛不均匀硬币,产生概率为1/2的事件
连续抛两次硬币,如果两次得到的相同则重新抛两次;否则根据第一次(或第二次)的正面反面情况,就可以得到两个概率相等的事件。
13. 机器学习里面为什么有概率
事件的概率是衡量事件发生可能性的度量,虽然再一次试验中某个事件的发生是带有偶然性的,但那些可在相同条件下重复的随机试验却往往呈现明显的数量规律。
机器学习就是创造这种条件,在新的实验到来时候,会产生相同的事件
14. 大数定理和中间极限定理的作用和意义?
大数定理的意义:频率会随着试验次数无穷增大时无穷趋近真正的数学期望
中间极限定理的意义:中心极限定理(CLT)指出,如果样本量足够大,则变量均值的采样分布将近似于正态分布,而与该变量在总体中的分布无关。中心极限定理意味着即使数据分布不是正态的,从中抽取的样本均值的分布也是正态的。