带你读《2022技术人的百宝黑皮书》——因果推断:效应估计的常用方法及工具变量讨论(3) https://developer.aliyun.com/article/1247906?groupCode=taobaotech
那么对于工具变量 Z ,它需要满足以下三个条件: (1) Z 和 A 相关;(2) Z 仅通过 A 影响Y,而不能直接影响Y;(3) Z 和 Y 没有共同诱因。对于图上这个双盲随机试验中, Z 就是一个工具变量。 我们逐个来看三个条件:Z (1) 被分配到治疗组的被试更可能接受治疗,满足Z 和 A 相关,(2) 这是一个双盲设计,满足Z 仅通过 A 影响Y,而不能直接影响Y,(3)治疗组的分配是随机的,不受任何其他因素影响,满足Z 和 Y 没有共同诱因。并且,在图 2.1 中,工具变量 Z 对实际治疗 A 有因果效应,我们将 Z 称作因果性工具变量。
在What if的前几章,作者用不同的方法在观察性数据中估计了戒烟对增重的因果效应。为了使用工具变量估计因果效应,我们需要一个工具变量 Z 。然而观察性研究并不像随机试验一样有一个表示随机分组的变量,所以我们需要使用其他变量作为我们的工具变量,其中一个可能选项是香烟的价格。香烟价格似乎能满足工具变量的三个条件:
(1)香烟价格能影响一个人是否戒烟;(2) 香烟价格只通过戒烟与否对体重产生影响;(3)香烟价格和增重之间没有共同诱因。
现在我们有了香烟价格Z这个变量,并把它用在我们接下来的讨论当中。假设Z =1表示研究参与人员所在州的香烟均价高于 1.5 美元, Z = 0 表示其他情况。不过,我们依然不能判定 Z 是否是一个工具变量。在工具变量的三个条件中,只有(1)是可验证的,此时我们只需证明 Z 和A相关,也即图片。Z =1时有25.8%的人戒烟;Z =0时有 19.5%的人戒烟。因而图片。在我们的例子中,Z 和A微弱相关,此时Z 被称为弱工具变量。
然而,我们不能验证条件(2)和(3)。为了验证条件(2),我们需要证明 Z 只通过 A 影响 Y。但如果存在Uz,就可能存在一条对撞路径 Z <- Uz -> A <- U ->Y,此时控制 A 就会使得 Z 和Y 相关,也就不能用这一方法验证条件(2)。同样,我们也不能验证条件(3),因为我们没有办法知道效应估计中是否存在混杂。我们只能假设(2)和(3)成立。因此,工具变量这一方法和其他方法一样,需要依赖于一些不可验证的假设。
(有些时候,我们能够利用数据证伪(2)和(3),然而,证伪只能通过验证假设中的一小部分不成立从而拒绝假设,并不具备效力说明假设中的大部分是否不成立。)
在观察性研究中,我们不能证明我们认为的工具变量 Z 是否是真正的工具变量,所以我们将 Z 称为候选工具变量。我们能做的,就是利用各专业知识说明候选变量 Z 为什么能满足条件 (2)和(3) 。这就如同前几章我们用专业知识为
我们的模型假设辩护一样。 ---先验知识/业务经验的重要性。
带你读《2022技术人的百宝黑皮书》——因果推断:效应估计的常用方法及工具变量讨论(5) https://developer.aliyun.com/article/1247903?groupCode=taobaotech