带你读《2022技术人的百宝黑皮书》——因果推断:效应估计的常用方法及工具变量讨论(9)

简介: 带你读《2022技术人的百宝黑皮书》——因果推断:效应估计的常用方法及工具变量讨论(9)

带你读《2022技术人的百宝黑皮书》——因果推断:效应估计的常用方法及工具变量讨论(8) https://developer.aliyun.com/article/1247900?groupCode=taobaotech



再谈工具变量的三个条件


工具变量三个条件的剖析


前两个小节我们讨论了同质性或单调性作为工具变量第四个条件的优劣。我们的讨论都假设了Z 是一个有效的工具变量。然而在观察性研究中,Z 可能并不满足工具变量三个条件中的 (2)和(3),因而就不是一个有效的工具变量;也可能 Z 仅仅勉强满足(1),那么Z 就只是一个弱工具变量。在这两种情况中,就算条件(4)完美成立,使用工具变量也会导致很强的偏移。现在,我们再详细讨论一下每个条件:


条件(1):Z 和 A 相关。这一条件可以实证地验证。研究者在使用工具变量之前,需要先验证 Z 和 A 是否相关。然而,就像我们戒烟例子中一样,如果 Z 和 A 之间的相关性很弱,那就是一个弱工具变量,这可能带来三个严重的问题:


第一,弱工具变量会导致 95%置信区间变宽。


第二,弱工具变量会放大因条件(2)和(3) 不成立带来的偏移。 Z 和A 的弱相关性会使得工具变量效应估计中的分母变小,而条件(2)和 (3)影响的是分子,如果分子有偏移,那么这一偏移将会被放大。在我们戒烟的例子中,任何分子中的偏移都会被乘以 15.9(1/0.0627)。


第三,即使样本够大,弱工具变量也会带来偏移,并导致效应估计方差的低估。也即,效应估计是错误的,且置信区间太窄了。


条件(2):Z 仅通过A 影响Y ,而不能直接影响Y 。在因果图中,如果有箭头从 Z 指向 Y ,那就违反了条件(2),就如图 3.4.1 所示。这一箭头不经过治疗 A ,因而将会直接作用于工具变量效应估计的分子,而这一额外部分也会被视为 A 的效应的一部分,从而被分母扩大。在图3.4.2中,条件(2)对原变量 A 成立,但对于A*并不成立,这是因为 路径 Z → A → Y 所表示的 Z 的效应并没有经过 A*,而我们估计的却是 A的效应。在实践中,为了简便,很多时候我们只能用近似的 A*(如上文提到的香烟价格是否>=1.5)替代真实的 A,这种近似替代是工具变量的一个主要问题。


image.png



带你读《2022技术人的百宝黑皮书》——因果推断:效应估计的常用方法及工具变量讨论(10) https://developer.aliyun.com/article/1247898?groupCode=taobaotech

相关文章
|
存储 数据安全/隐私保护 索引
Windows Server 各版本搭建文件服务器实现共享文件(03~19)
Windows Server 各版本搭建文件服务器实现共享文件(03~19)
|
机器学习/深度学习 自然语言处理 自动驾驶
深度学习的应用实例:重塑各个领域的未来
深度学习的应用实例:重塑各个领域的未来
775 0
|
11月前
|
安全 API 开发工具
【HarmonyOS NEXT】一键扫码功能
这些Kit为我们应用开发提升了极大地效率。很多简单的功能,如果不需要太深的定制化需求,直接调用kit提供的API就可以实现,在android或者ios上需要很多代码才能实现的功能效果。
324 0
|
监控 数据可视化 安全
看得见的安全:如何用可视化大屏提升数据监测和网络预警效率
网络安全已成各组织核心议题,传统防护难以应对复杂攻击。AnaTraf网络流量分析仪通过实时分析流量,提取关键行为,提前发现潜在威胁。其可视化大屏将数据直观呈现,助力安全人员快速捕捉风险。系统基于趋势分析构建动态风险模型,实现预判而非仅报警,成为有判断力的“网络安全参谋”。在攻击无孔不入的时代,AnaTraf提供全新认知方式,以“看得见”提升对威胁的判断力。
看得见的安全:如何用可视化大屏提升数据监测和网络预警效率
|
人工智能 Java 程序员
一文彻底搞明白PCB加工工艺
PCB加工工艺简介:从覆铜板开始,经过设计、钻孔、显影、蚀刻、阻焊涂层、保留焊盘、丝印等步骤,最终制成电路板。覆铜板由铜箔和绝缘基材组成,设计阶段使用EDA软件完成布线图。钻孔后,通过显影将防腐材料印刷在板上,蚀刻去除多余铜层,形成导电路径。阻焊涂层保护铜线,防止老化和短路。保留焊盘确保电子元件可焊接,丝印则添加标识符号简化焊接与维修。可选镀金处理提高抗氧化性和电气稳定性,广泛应用于高性能设备的接口。
719 0
|
数据采集 数据可视化 数据挖掘
使用R语言进行主成分分析(PCA)
【4月更文挑战第26天】本文介绍了如何使用R语言进行主成分分析(PCA),包括安装必要包`stats`、`FactoMineR`和`factoextra`,数据预处理如标准化,使用`PCA()`函数执行PCA,以及通过`summary()`、`fviz_pca_ind()`和`fviz_pca_var()`进行结果解读和可视化。此外,还讨论了如何通过载荷系数解释主成分,强调PCA在数据降维和探索数据结构中的作用。
1568 1
|
机器学习/深度学习 人工智能 编解码
|
存储 人工智能 弹性计算
自动化搭建专属 AI 绘图服务
本文介绍了如何使用通义万相AIGC技术和阿里云的计算和存储产品来搭建自己的AI绘画服务。首先,通过创建基础云产品资源和部署AI绘画服务的步骤来开始搭建服务。然后,介绍了模板的原理和内容,以及ROS编排引擎的作用。接下来,详细介绍了AI绘画服务的一键部署过程,包括定义参数、模板的编写和ROS的使用。最后,提到了应用运行环境的搭建和自定义应用页面的方法。通过ROS的自动化部署,用户可以方便快捷地拥有自己的AI绘画服务。
|
SQL 人工智能 JSON
【AI大模型应用开发】2.2 Function Calling连接外部世界 - 【实战】查询数据库
【AI大模型应用开发】2.2 Function Calling连接外部世界 - 【实战】查询数据库
664 0
|
机器学习/深度学习 分布式计算 C++
带你读《2022技术人的百宝黑皮书》——因果推断:效应估计的常用方法及工具变量讨论(3)
带你读《2022技术人的百宝黑皮书》——因果推断:效应估计的常用方法及工具变量讨论(3)
527 1