带你读《2022技术人的百宝黑皮书》——因果推断:效应估计的常用方法及工具变量讨论(1) https://developer.aliyun.com/article/1247908?groupCode=taobaotech
效应估计的常用方法
不能有未被观察到的混杂因素:通俗来讲,我们需要知道所有可能影响“果”的因素,这类方法包括 匹配类方法(PSM、CEM、IPTW、DID、合成控制法)、Uplift Models、断点回归等。其中:
倾向性得分匹配(PSM,Propensity Score Method):主要是基于用户特征来预测用户被活动干预的概率作为倾向得分,选取和实验组用户倾向得分最接近的用户作为对照组;“倾向性得分”是一个用户属于实验组的 “倾向性”,理论上,如果我们对每一个实验组用户都在对照组里匹配一个得分相等的用户,就能得到同质的实验组和对照组,进而来做组间比较。“倾向性得分匹配” 适用于样本属性的维度很高或者有一些(不好切断的)连续变量,为实验组找到匹配的对照组,消除混杂因子[2]。
广义精确匹配(CEM,Coarsened Exact Matching):主要是使用核心混杂因子(对“果”/“因变量” 影响较大的用户特征)进行匹配,每个实验用户匹配到的N个同特征用户作为对照组,取N个同特征用户的核心指标均值作为实验用户的对照。CEM主要用于用户量特别大的场景,在这种情况下预测倾向得分依赖于大量的计算资源和较优的模型效果,导致PSM会受到一定的影响。
逆策略概率加权(IPTW,Inverse Probability of Treatment Weighting):基于PSM,对策略效果进行加权计算,通俗来讲,就是样本越倾向选择这个策略,那么说明这个策略对该样本可能获得更好的策略效果,所以取逆得到的权重来平衡这个策略效果[3,4]。
双重差分模型(DID,Difference in Differences):本质是寻找自然对照组,是政策效果评估中常用的一种计量识别策略,原理是基于反事实框架来评估政策发生(e.g. A市开通高铁,实验组)和不发生(e.g. 与A市近似同质、且未开通高铁的B市,对照组)这两种情景下因变量(e.g. GDP增长)的变化。
合成控制法(SCM,Synthetic Control Methods):基于DID,基本思想是,我们通常很难找到与A市完全相似的B市,但通常可对若干大城市进行适当的线性组合,以构造一个更为优秀的“合成控制地区” (synthetic control region),并将“真实A市”与“合成A市”进行对比,故名“合成控制法”。合成控制法能够克服在选取对照对象时出现的样本选择偏误以及政策内生性问题。使用这个方法的一个关键点在于选择好最优权重矩阵,使得合成的对照组与实验组在treatment前的情况高度类似[5]。
带你读《2022技术人的百宝黑皮书》——因果推断:效应估计的常用方法及工具变量讨论(3) https://developer.aliyun.com/article/1247906?groupCode=taobaotech