带你读《2022技术人的百宝黑皮书》——倾向得分匹配(PSM)的原理以及应用(6) https://developer.aliyun.com/article/1247861?groupCode=taobaotech
其他值得一提的点
ATT与ATE的区别
1. ATE:average treatment effect
2. ATT:average treatment effect on the treated
可以认为ATE是人群整体的干预增量效果,而ATT是实际被干预人群的干预增量效果。通常我们通过PSM+DID计算的是ATT,因为ATE还会涉及人群的干预率。更详细的解释可以参考stackexchange上的这个回答:
https://stats.stackexchange.com/questions/308397/why-is-average-treatment-effect-different from-average-treatment-effect-on-the-t
Bias与Variance
在匹配算法的步骤,我们有提到bias与varianc:
1. Bias 偏差:期望预测与真实结果之间的偏离程度,刻画算法本身的拟合能力
2. Variance 方差:同样大小训练集的变动所导致的学习性能变化,刻画数据扰动所造成的影响
可以认为bias代表算法本身的拟合能力而variance代表算法的稳定性,在匹配的不同方法中它们也存在trade-offs:
敏感性测试 Sensitivity Analysis
在前置知识介绍的部分有提到,做PSM需要满足两个假设——条件独立和共支撑。
对于第一个条件,其含义便是我们需要观测到所有同时影响到treatment和outcome的特征,否则估算的ATT会存在偏差。对于common support,我们实际上计算的是倾向得分重叠区域的ATT,其实际上也可能是有偏的。在这种情况下,我们需要去进行sensitivity analysis。换句话说,我们计算得到的增量结果其实是不稳健的,我们可以通过纳入不确定性的来估算一个ATT的区间,使之稳定性得到提升。
带你读《2022技术人的百宝黑皮书》——倾向得分匹配(PSM)的原理以及应用(8) https://developer.aliyun.com/article/1247859?groupCode=taobaotech