带你读《2022技术人的百宝黑皮书》——因果推断:效应估计的常用方法及工具变量讨论(4) https://developer.aliyun.com/article/1247905?groupCode=taobaotech
工具变量的效应估计
如果 Z 满足工具变量的三个条件(以及一个额外条件,我们将在下一小节讨论),并且是一个二分变量,那么在加法尺度上,工具变量的效应估计就可以表示为:
为了直观地理解这一表达式,我们可以再思考一下上一小节中的随机试验。这个表达式中的:
1. 等式左边:是A对Y的效应
2. 等式右边-分子:是 Z 对 Y 的效应,也被称为治疗意向效应,Z 是工具变量,Y是“果”
3. 等式右边-分母:是 Z 对 A 的效应,表示被试的配合程度,Z是工具变量,A是“因”
如果被试完全配合研究人员,那么分母就等于1, A 对 Y 的效应就等于 Z 对 Y 的效应(完美的随机实验)。如果配合程度不佳,那么分母就会趋近于 0(小于1),从而有 A 对Y 的效应大于 Z 对 Y 的效应。不配合的被试越多,这两个效应之间的差距也就越大。 这一效应估计不需要调整任何混杂,而是通过给治疗意向效应乘以一个膨胀系数得到。被试的配合程度越低,也即 Z -A 之间的关系越接近于 0,那膨胀系数也就越大,在观察性研究中同理。
所以,使用工具变量时,我们需要对这一表达式分子和分母中的效应进行估计。在我们戒烟的例子中,工具变量 Z 是一个二分变量(1:参与人员所在州的香烟均价高于 1.5 美元,0:其他)。
1. 分子的估计值是
2. 而分母的估计值为
3. 因而可以得到治疗效应的估计值是 0.153 / 0.0627 = 2.4 kg
在工具变量的三个条件以及第四个附加条件之下,2.4kg就是戒烟对增重的因果效应均值 (这一方法也被称为 Wald 估计法) 。
除了Wald估计法以外,我们也可以用双阶最小二乘法拟合两个(饱和)线性模型从而估计表达式中的分 子和分母(需要作出很强的参数假设),也可以使用结构模型(避开强假设)、然后通过G-估算 计算结构模型中的某些参数。在工具变量中到底是使用二阶最小二乘法还是使用结构模型, 就类似于在没有工具变量的时候到底是使用结局回归还是结构嵌入模型一样,各有利弊。
不过无论如何,本小节介绍的表达式如果要被认为是治疗 A 对结局 Y 的因果效应均值,那我们需要工具变量的第四个条件成立。接下来,我们将讨论第四个条件。
带你读《2022技术人的百宝黑皮书》——因果推断:效应估计的常用方法及工具变量讨论(6) https://developer.aliyun.com/article/1247902?groupCode=taobaotech